Décisions stratégiques initiales

Dernière mise à jour : 04 mars 2025

Avant de commencer à planifier votre solution d'IA générative, vous devez prendre certaines décisions stratégiques clés. Votre stratégie doit tenir compte des exigences et des priorités de votre organisation, des compétences et des préférences de votre équipe de développement, de vos besoins en données et des exigences de la solution.

Pour définir la stratégie de mise en œuvre de votre solution d'IA générative, prenez les décisions suivantes :

Quel est votre cas d'utilisation ?
Qui impliquer ?
Comment gérer les risques et la conformité
Comment développer votre solution
Comment choisir un modèle
Comment préparer les données
Comment évaluer la qualité et réduire les risques
Comment optimiser et gérer les modèles de fondation
Comment fournir et maintenir votre solution

Quel est votre cas d'utilisation ?

Comprenez l'objectif de votre solution, si cet objectif est réalisable et utile, et comment vous pouvez déterminer quand votre solution est prête :

Tâche d'IA générative: Que doit faire le modèle ?
Sorties conversationnelles ou séparées: Déterminez si vous avez besoin d'une expérience conversationnelle où les utilisateurs discutent avec un modèle qui conserve le contexte des interactions précédentes ou si chaque interaction avec le modèle est distincte. Certaines tâches, telles que la classification, le résumé ou la génération, peuvent ne pas bénéficier d'une conversation. Les conversations coûtent plus cher que les sorties séparées parce que les conversations incluent l'historique du chat avec chaque entrée.
Faisabilité: Comprendre les limites des modèles de fondation afin de pouvoir évaluer si votre cas d'utilisation est réalisable. Par exemple, vous pouvez vérifier les scores de référence des modèles pour le type de cas d'utilisation que vous souhaitez mettre en œuvre.
Valeur commerciale: Déterminez si les avantages de la solution sont supérieurs à son coût de fonctionnement.
Critères de réussite: Décider comment mesurer le succès de la solution. Vous pouvez par exemple vous appuyer sur des mesures d'évaluation ou sur le retour d'information des utilisateurs cibles.

Qui impliquer ?

Si vous impliquez les parties prenantes appropriées dès le début, vous risquez moins de devoir changer de direction ou de répéter certaines parties du processus. Au minimum, il faut impliquer les parties prenantes de ces équipes dans le processus de planification :

Les personnes qui définissent les priorités et les processus de votre organisation: Vous avez besoin de ces personnes pour vous informer des exigences et des restrictions que vous devez respecter. Vous pouvez avoir besoin de documenter des informations spécifiques sur votre solution, de suivre un flux de travail pour vous conformer à une réglementation, ou de sélectionner un modèle avec un type de source spécifique. Par exemple, votre organisation peut exiger que vous choisissiez un modèle open source.
Les utilisateurs de la solution: Vous avez besoin de ces personnes pour définir les exigences de la solution et pour aider à tester et à valider le fonctionnement de la solution dans leurs processus.
Les personnes qui créent la solution: Ces personnes doivent être impliquées dans les décisions de conception et d'exploitation. Cette équipe de collaborateurs peut comprendre des concepteurs, des ingénieurs de données, des ingénieurs en IA, des data scientists et des responsables du risque et de la conformité. Si vous mettez en œuvre une solution de génération augmentée par extraction pour votre documentation, pensez à inclure vos rédacteurs de contenu, qui peuvent adapter le contenu à l'IA.

Comment gérer les risques et la conformité

Si vous comprenez vos risques et vos besoins en matière de conformité avant de commencer à développer votre solution, vous serez mieux préparé pour les audits ultérieurs.

Risques liés à l'IA: Comprendre les principales dimensions du risque, telles que le risque de réputation, le risque réglementaire et le risque opérationnel. Les risques liés à l'utilisation de l'IA générative comprennent les mêmes risques que pour les modèles d'apprentissage automatique traditionnels, les risques amplifiés par l'IA générative et de nouveaux risques spécifiques à l'IA générative. Par exemple, le risque de générer des résultats contenant des faits inexacts ou mensongers, que l'on qualifie d'hallucinations, est spécifique à l'IA générative.
Conformité juridique et réglementaire: Déterminez les lois et règlements auxquels vous devez vous conformer, les méthodes de suivi de la conformité et les méthodes de garantie de la conformité. Par exemple, votre organisation peut exiger une évaluation formelle des risques ou un processus d'approbation pour les solutions d'IA.
Documentation sur les cas d'utilisation: Créez un cas d'utilisation de l'IA pour recueillir toutes les informations nécessaires à la gestion d'un modèle ou d'un modèle d'invite depuis la phase de demande jusqu'à la production, en passant par le développement. Le fait de documenter votre cas d'utilisation constitue un moyen pratique de suivre vos progrès, que votre organisation l'exige ou non à des fins réglementaires.

Plus d'informations sur le risque et la conformité

Comment développer votre solution

Vous et votre équipe de développement pouvez choisir entre différents outils et méthodes dans l'interface utilisateur de watsonx.ai ou travailler entièrement avec du code :

Langages de codage

Si vous souhaitez écrire du code, vous avez le choix entre les API REST, Python et Node.js. Les facteurs de choix du langage incluent les préférences et les compétences de vos développeurs, la manière dont vous souhaitez déployer la solution, et la quantité de travail que votre équipe souhaite effectuer dans son environnement de développement interactif (IDE) par rapport à l'interface utilisateur de watsonx.ai

Niveau d'automatisation

Vous pouvez choisir la part du code de votre solution qui sera générée pour vous :

Pas de code : Vous pouvez effectuer toutes les tâches d'ingénierie rapide, de mise au point de modèles, d'intégration de documents et de vectorisation à l'aide d'outils. Par exemple, vous pouvez automatiser la recherche du meilleur modèle RAG avec l' AutoAI, créer un modèle d'invite dans l' Prompt Lab, et construire un agent IA dans Agent Lab.
Un peu de code : Vous pouvez générer des carnets Python à l'aide de nombreux outils, puis adapter le code en fonction des besoins. Par exemple, vous pouvez générer un carnet de notes basé sur un modèle d'invite, pour l'intégration et la vectorisation de documents, ou pour la mise en œuvre d'un agent d'IA.
Tout le code : Vous pouvez écrire du code avec les API REST dans votre IDE. Vous pouvez écrire et exécuter du code avec des bibliothèques Python à l'aide de l'éditeur notebook.

Fonctionnalité

La plupart des fonctionnalités d' watsonx.ai s sont disponibles à la fois avec des outils dans l'interface utilisateur et avec du code, tels que des API et des SDK.

Plus d'informations sur les méthodes de travail

Comment choisir un modèle

Il n'est pas nécessaire de choisir un modèle avant d'élaborer un plan pour votre solution. Cependant, si vous comprenez quels sont les critères les plus importants pour vous et votre organisation, vous pouvez réduire le risque de choisir un modèle inapproprié.

Tâche: La tâche que vous souhaitez confier au modèle peut être un facteur limitant dans le choix d'un modèle. Pour de nombreuses tâches, vous pouvez choisir entre plusieurs modèles. Cependant, pour d'autres tâches modèles, telles que la traduction ou la réponse dans une langue autre que l'anglais, vous avez moins de choix.
Coût: Le coût de l'inférence varie d'un modèle à l'autre. Si la réduction des coûts d'inférence est une priorité pour vous, choisissez un modèle moins cher, un modèle plus petit, un modèle quantifié ou un modèle que vous pouvez ajuster.
Impact environnemental: En général, les modèles de grande taille ont un impact environnemental plus important, tant au niveau de l'apprentissage que de l'inférence. Les modèles plus petits et les modèles quantifiés ont un impact moindre sur l'environnement.
Précision et autres scores: Vous pouvez comparer les modèles et choisir celui qui obtient les meilleurs résultats dans les domaines les plus importants pour vous.
Indemnité et origine du modèle: Votre organisation peut avoir des politiques concernant le choix de modèles qui sont transparents sur leurs données de formation, qui sont open source ou qui offrent une indemnisation.
Personnalisation: Vous pouvez personnaliser un modèle pour un domaine spécifique en le réglant. Vous pouvez choisir de régler certains modèles fournis avec watsonx.ai dans le Tuning Tuning Studio. Vous pouvez également mettre au point un modèle dans un outil externe et importer votre modèle personnalisé dans watsonx.ai; Vous pouvez ajouter des connaissances ou des compétences aux modèles IBM Granite avec InstructLab.; Si vous souhaitez déployer des modèles de base dans votre propre centre de données, vous pouvez acheter et installer le logiciel d' watsonx.ai.

Plus d'informations sur le choix d'un modèle de fondation

Comment préparer les données

Les modèles de fondation sont formés sur de grandes quantités de données, mais pas sur les données internes de votre entreprise. Si vous avez besoin d'un modèle de base pour connaître les données de votre entreprise, vous devez décider comment fournir vos données au modèle.

Documents de mise à la terre: Si vous avez besoin d'une solution qui réponde aux questions en fondant le modèle sur les informations contenues dans vos documents, vous pouvez mettre en place un modèle de génération augmentée par la recherche (RAG). Dans un modèle RAG, vous vectorisez vos documents pour une recherche efficace des passages qui répondent aux questions de l'utilisateur.
Données de réglage et de test: Si vous avez besoin d'améliorer ou d'adapter le résultat pour des tâches de traitement du langage naturel telles que la classification, le résumé et la génération, vous pouvez ajuster le modèle. Si vous souhaitez tester la qualité de votre message, vous pouvez l'évaluer à l'aide de mesures d'IA générative. Pour les deux tâches, vous devez fournir un ensemble d'exemples validés d'entrée et de sortie d'invite. Si vos données contiennent des informations sensibles, telles que des informations personnelles identifiables (IPI), assurez-vous de connaître la politique de votre organisation en matière d'IPI. Par exemple, vous pouvez avoir besoin de masquer des informations nominatives ou de générer des données synthétiques pour ajuster ou tester votre modèle.
Connaissances ou compétences: Fournir des ensembles de données qui alimentent le modèle. Vous pouvez utiliser IntructLab pour améliorer un modèle de base existant avec les fonctionnalités nécessaires à votre cas d'utilisation. Vous fournissez des exemples de base ou des données de base qui servent de base à la génération de données synthétiques pour l'ajustement de l'instruction du modèle de base.

Plus d'informations sur la préparation des données

Comment évaluer la qualité et réduire les risques

Vous devez décider comment mesurer la qualité et assurer la sécurité.

Évaluation: Vous pouvez évaluer les performances de la solution et les risques par rapport à des mesures standard. Vous pouvez mesurer la précision, la similarité et la qualité textuelles de la sortie du modèle de base. Vous pouvez également évaluer l'équité, la performance et la dérive des résultats du modèle. Vous pouvez évaluer les performances de plusieurs actifs simultanément et consulter des analyses comparatives des résultats pour identifier les meilleures solutions. Ces paramètres vous aident à vous assurer que les solutions d'IA sont exemptes de préjugés, qu'elles peuvent être facilement expliquées et comprises par les utilisateurs professionnels et qu'elles sont vérifiables dans les transactions commerciales.
Evaluation des risques: Vous pouvez identifier les risques potentiels en remplissant un questionnaire d'évaluation des risques.
Glissières de sécurité: Vous pouvez activer les garde-fous pour supprimer le contenu potentiellement dangereux ou le contenu PII du texte d'entrée et de sortie des invites.
Tests: Envisager la mise en place d'une équipe rouge pour simuler des attaques adverses.

Plus d'informations sur l'évaluation de la qualité et l'atténuation des risques

Comment optimiser et gérer les modèles de fondation

Vous pouvez optimiser un modèle de base en termes de précision, de coût, de latence d'inférence et de contrôle du cycle de vie du modèle.

Optimisation par défaut: IBM propose un ensemble de modèles de base qui sont déployés sur du matériel multi-tenant. Vous payez l'inférence par jeton. IBM contrôle le cycle de vie des modèles en les mettant à jour et en les supprimant. Lorsqu'un modèle est obsolète, vous devez mettre à jour votre solution pour inférer la nouvelle version du modèle ou un modèle différent.
Optimiser la précision et les coûts: Si vous avez besoin d'améliorer la précision de votre modèle et de réduire les coûts en déduisant un modèle de base plus petit, vous pouvez ajuster un modèle de base fourni. Vous déployez un modèle d'accord d'invite sur du matériel multilocataire et payez l'inférence par jeton.
Optimiser la précision et le contrôle: Si vous avez formé ou ajusté un modèle en dehors de watsonx.ai pour votre cas d'utilisation, vous pouvez importer et déployer un modèle personnalisé. Vous déployez le modèle sur du matériel dédié. Vous payez à l'heure pour l'hébergement du modèle et non pour l'inférence. Vous contrôlez le cycle de vie du modèle.
Optimiser la latence et le contrôle: Si votre solution doit prendre en charge un grand nombre d'utilisateurs simultanés, vous pouvez déployer un modèle de déploiement à la demande fourni par IBM sur du matériel dédié. Le matériel dédié offre une latence plus faible que le matériel multi-locataires. Vous payez à l'heure pour l'hébergement du modèle et non pour l'inférence. Vous contrôlez le cycle de vie du modèle.

Plus d'informations sur l'optimisation et la gestion des modèles de fondation

Comment fournir et maintenir votre solution

Vous devez décider comment fournir votre solution d'IA générique et contribuer à garantir sa qualité continue.

Déployer votre solution: Pour inférer un modèle de base, vous déployez un point de terminaison que vous appelez dans votre application pour inférer le modèle. Selon l'architecture de votre solution d'IA générique, le point de terminaison peut se trouver dans un extrait de code, une fonction d' Python, un service d'IA ou un code développé par votre équipe.
Gérer ModelOps avec des espaces de déploiement: Vous pouvez prendre en charge un flux ModelOps en créant des espaces de déploiement distincts pour les versions de test, de préparation et de production de votre solution. Vous pouvez gérer l'accès à votre solution de production en ajoutant les collaborateurs appropriés à chaque espace.
Monitoring: Comme pour l'évaluation de votre solution au cours de son développement, vous pouvez contrôler les performances de la solution et les risques, tels que l'équité, la qualité et l'explicabilité. Vous pouvez visualiser les tendances dans le temps et définir des seuils pour vous alerter en cas de baisse des performances.
Commentaires en retour des utilisateurs: Envisagez de mettre en place un mécanisme de retour d'information de la part des utilisateurs et de créer un processus pour recueillir ce retour d'information et améliorer votre solution en conséquence. Par exemple, si vous mettez en œuvre un modèle RAG, vous pouvez ajouter un mécanisme de retour d'information permettant aux utilisateurs d'évaluer les réponses à leurs questions. Vous pouvez mettre en place un processus d'évaluation des réponses incorrectes et inadéquates et soit adapter le modèle RAG, soit adapter votre contenu pour fournir de meilleures réponses.

Plus d'informations sur la livraison et la maintenance

En savoir plus

Comparaison des outils avec le code

Sujet parent : Planifier une solution d'IA générative

La rubrique a-t-elle été utile ?

0/1000

Quel est votre cas d'utilisation ?Copy link to section

Qui impliquer ?Copy link to section

Comment gérer les risques et la conformitéCopy link to section

Plus d'informations sur le risque et la conformitéCopy link to section

Comment développer votre solutionCopy link to section

Plus d'informations sur les méthodes de travailCopy link to section

Comment choisir un modèleCopy link to section

Plus d'informations sur le choix d'un modèle de fondationCopy link to section

Comment préparer les donnéesCopy link to section

Plus d'informations sur la préparation des donnéesCopy link to section

Comment évaluer la qualité et réduire les risquesCopy link to section

Plus d'informations sur l'évaluation de la qualité et l'atténuation des risquesCopy link to section

Comment optimiser et gérer les modèles de fondationCopy link to section

Plus d'informations sur l'optimisation et la gestion des modèles de fondationCopy link to section

Comment fournir et maintenir votre solutionCopy link to section

Plus d'informations sur la livraison et la maintenanceCopy link to section

En savoir plusCopy link to section