Décisions stratégiques initiales

Dernière mise à jour : 23 avr. 2025
Décisions stratégiques initiales

Avant de commencer à planifier votre solution d'IA générative ou d'apprentissage automatique, vous devez prendre certaines décisions stratégiques clés. Votre stratégie doit tenir compte des exigences et des priorités de votre organisation, des compétences et des préférences de votre équipe de développement, de vos besoins en données et des exigences de la solution.

Pour définir la stratégie de mise en œuvre de votre solution d'IA, prenez les décisions suivantes :

Quel est votre cas d'utilisation ?

Comprenez l'objectif de votre solution, si cet objectif est réalisable et utile, et comment vous pouvez déterminer quand votre solution est prête :

Tâche d'IA
Que doit faire le modèle ?
Faisabilité
Comprenez les limites de l'IA afin de pouvoir évaluer si votre cas d'utilisation est réalisable.
Par exemple, vous pouvez vérifier les scores de référence des modèles de fondation pour le type de cas d'utilisation que vous souhaitez mettre en œuvre.
Par exemple, pour former un modèle d'apprentissage automatique (ML), vous avez besoin de suffisamment de données étiquetées de haute qualité pour qu'un algorithme puisse faire des prédictions ou des classifications précises.
Valeur commerciale
Déterminez si les avantages de la solution sont supérieurs à son coût de fonctionnement.
Critères de réussite
Décider comment mesurer le succès de la solution. Vous pouvez par exemple vous appuyer sur des mesures d'évaluation ou sur le retour d'information des utilisateurs cibles.

Mise en œuvre de l'IA générique ou de l'apprentissage automatique

Le type de données avec lesquelles vous prévoyez de travailler et ce que vous voulez faire avec ces données peuvent vous aider à décider si vous avez besoin de l'apprentissage automatique ou de l'IA générative.

Type de données
Le fait que les données que vous souhaitez traiter avec l'IA soient structurées ou non peut souvent indiquer le type d'IA dont vous avez besoin :
  • Structuré : Si vous disposez d'ensembles de données étiquetées sous forme de tableaux, vous avez probablement besoin de l'apprentissage automatique.
  • Non structurées : Si vous disposez de grandes quantités de documents ou d'autres types de données non structurées, vous avez probablement besoin de l'IA générative.
Type d'objectif
Que vous souhaitiez analyser vos données à l'aide d'algorithmes mathématiques ou générer de nouveaux contenus indique le type d'IA dont vous avez besoin :
  • Analyser ou classer vos données : Si vous souhaitez utiliser des équations mathématiques et statistiques pour analyser des données structurées, vous avez besoin de l'apprentissage automatique. Par exemple, l'apprentissage automatique permet de faire des prédictions, de détecter des modèles et de résoudre des problèmes d'optimisation.
  • Générer du contenu : Si vous souhaitez générer du contenu non structuré, vous avez besoin d'une IA générative. Par exemple, avec l'IA générique, vous pouvez résumer, classer, traduire et générer du texte ou du code.

Plus d'informations sur la différence entre ML et gen AI

Qui impliquer ?

Si vous impliquez les parties prenantes appropriées dès le début, vous risquez moins de devoir changer de direction ou de répéter certaines parties du processus. Au minimum, il faut impliquer les parties prenantes de ces équipes dans le processus de planification :

Les personnes qui définissent les priorités et les processus de votre organisation
Vous avez besoin de ces personnes pour vous informer des exigences et des restrictions que vous devez respecter. Vous pouvez avoir besoin de documenter des informations spécifiques sur votre solution, de suivre un flux de travail pour vous conformer à une réglementation, ou de sélectionner un modèle de base avec un type de source spécifique. Par exemple, votre organisation peut exiger que vous choisissiez un modèle de fondation open source.
Les utilisateurs de la solution
Vous avez besoin de ces personnes pour définir les exigences de la solution et pour aider à tester et à valider le fonctionnement de la solution dans leurs processus.
Les personnes qui créent la solution
Ces personnes doivent être impliquées dans les décisions de conception et d'exploitation. Cette équipe de collaborateurs peut comprendre des concepteurs, des ingénieurs de données, des ingénieurs en IA, des data scientists et des responsables du risque et de la conformité.
Par exemple, si vous mettez en œuvre une solution de génération augmentée par extraction pour votre documentation, pensez à inclure vos rédacteurs de contenu, qui peuvent adapter le contenu à l'IA.
Par exemple, si vous mettez en œuvre une solution de demande de prêt hypothécaire, veillez à impliquer les responsables du risque et de la conformité.

Comment gérer les risques et la conformité

Si vous comprenez vos risques et vos besoins en matière de conformité avant de commencer à développer votre solution, vous serez mieux préparé pour les audits ultérieurs.

Risques liés à l'IA
Comprendre les principales dimensions du risque, telles que le risque de réputation, le risque réglementaire et le risque opérationnel. De nombreux risques sont les mêmes pour l'utilisation de l'IA générative et des modèles d'apprentissage automatique, mais certains risques sont amplifiés par l'IA générative, et d'autres risques sont spécifiques à l'IA générative.
Par exemple, un modèle de fondation peut générer des résultats contenant des faits inexacts ou mensongers, ce qui est qualifié d'hallucinant.
Par exemple, votre modèle d'apprentissage automatique peut montrer une tendance à fournir des résultats favorables plus souvent pour un groupe que pour un autre.
Conformité juridique et réglementaire
Déterminez les lois et règlements auxquels vous devez vous conformer, les méthodes de suivi de la conformité et les méthodes de garantie de la conformité. Par exemple, votre organisation peut exiger une évaluation formelle des risques ou un processus d'approbation pour les solutions d'IA.
Documentation sur les cas d'utilisation
Créez un cas d'utilisation de l'IA pour recueillir toutes les informations nécessaires à la gestion d'un modèle ou d'un modèle d'invite depuis la phase de demande jusqu'à la production, en passant par le développement. Le fait de documenter votre cas d'utilisation constitue un moyen pratique de suivre vos progrès, que votre organisation l'exige ou non à des fins réglementaires.

Plus d'informations sur le risque et la conformité

Quelle est la part d'automatisation par rapport au code?

Vous et votre équipe de développement pouvez choisir entre différents outils et méthodes dans l'interface utilisateur de watsonx.ai ou travailler entièrement avec du code :

Langages de codage
Si vous souhaitez écrire du code, vous avez le choix entre les API REST, Python et Node.js. Les facteurs de choix du langage incluent les préférences et les compétences de vos développeurs, la manière dont vous souhaitez déployer la solution, et la quantité de travail que votre équipe souhaite effectuer dans son environnement de développement interactif (IDE) par rapport à l'interface utilisateur de watsonx.ai
Niveau d'automatisation
Vous pouvez choisir la part du code de votre solution qui sera générée pour vous :
  • Pas de code : Vous pouvez effectuer toutes les tâches d'ingénierie rapide, de mise au point de modèles, d'intégration de documents et de vectorisation à l'aide d'outils.
    • Par exemple, vous pouvez automatiser la recherche du meilleur modèle RAG avec AutoAI for RAG, créer un modèle d'invite dans Prompt Lab, et construire un agent d'IA dans Agent Lab.
    • Par exemple, vous pouvez automatiser la recherche des meilleurs algorithmes de données, transformations et paramètres avec AutoAI pour l'apprentissage automatique afin de créer le meilleur modèle prédictif. Vous pouvez développer des modèles prédictifs sur un canevas graphique avec SPSS Modeler.
  • Un peu de code : Vous pouvez générer des carnets Python à l'aide de nombreux outils, puis adapter le code en fonction des besoins.
    • Par exemple, vous pouvez générer un carnet de notes sur la base d'un modèle d'invite, pour incorporer et vectoriser des documents, ou pour mettre en œuvre un agent d'intelligence artificielle.
    • Par exemple, vous pouvez résoudre un problème d'analyse prescriptive à l'aide d'un bloc-notes Decision Optimization.
  • Tout le code : Vous pouvez écrire du code avec les API REST dans votre IDE. Vous pouvez écrire et exécuter du code avec des bibliothèques Python à l'aide de l'éditeur notebook.
Fonctionnalité
La plupart des fonctionnalités d' watsonx.ai s sont disponibles à la fois avec des outils dans l'interface utilisateur et avec du code, tels que des API et des SDK.

Plus d'informations sur les méthodes de travail

Comment choisir un modèle de fondation pour l'IA générique?

Il n'est pas nécessaire de choisir un modèle de base avant de planifier votre solution d'IA générique. Cependant, si vous comprenez quels sont les critères les plus importants pour vous et votre organisation, vous pouvez réduire le risque de choisir un modèle de fondation inapproprié.

Tâche
La tâche que vous souhaitez confier au modèle de fondation peut être un facteur limitant dans le choix d'un modèle de fondation. Pour de nombreuses tâches d'IA générique, vous avez le choix entre plusieurs modèles de fondation. Cependant, pour d'autres tâches d'IA générique, telles que la traduction ou la réponse dans une langue autre que l'anglais, vous avez moins de choix.
Coût
Le coût de l'inférence varie d'un modèle de fondation à l'autre. Si la réduction des coûts d'inférence est une priorité pour vous, choisissez un modèle de base moins cher, un modèle de base plus petit, un modèle de base quantifié ou un modèle de base que vous pouvez ajuster.
Impact environnemental
En général, les modèles de grande taille ont un impact environnemental plus important, tant au niveau de l'apprentissage que de l'inférence. Les modèles de fondation plus petits et les modèles de fondation quantifiés ont un impact moindre sur l'environnement.
Précision et autres scores
Vous pouvez comparer les points de référence des modèles de fondation et choisir le modèle de fondation qui obtient des résultats élevés dans les domaines les plus importants pour vous.
Indemnité et origine du modèle
Votre organisation peut avoir des politiques concernant le choix de modèles de fondation qui sont transparents quant à leurs données de formation, qui sont open source ou qui offrent une indemnisation.
Personnalisation
Vous pouvez personnaliser un modèle de base pour un domaine spécifique en le réglant. Vous pouvez choisir d'accorder certains modèles de fondations qui sont fournis avec watsonx.ai dans le site Tuning Studio. Vous pouvez également mettre au point un modèle de fondation dans un outil externe et importer votre modèle de fondation personnalisé dans watsonx.ai.
Vous pouvez ajouter des connaissances ou des compétences aux modèles IBM Granite avec InstructLab.
Si vous souhaitez déployer des modèles de base dans votre propre centre de données, vous pouvez acheter et installer le logiciel d' watsonx.ai.

Plus d'informations sur le choix d'un modèle de fondation

Comment préparer les données pour l'IA générique

Les modèles de fondation sont formés sur de grandes quantités de données, mais pas sur les données internes de votre entreprise. Si vous avez besoin d'un modèle de base pour connaître les données de votre entreprise, vous devez décider comment fournir vos données au modèle.

Documents de mise à la terre
Si vous avez besoin d'une solution qui réponde aux questions en fondant le modèle sur les informations contenues dans vos documents, vous pouvez mettre en place un modèle de génération augmentée par la recherche (RAG). Dans un modèle RAG, vous vectorisez vos documents pour une recherche efficace des passages qui répondent aux questions de l'utilisateur.
Données de réglage et de test
Si vous avez besoin d'améliorer ou d'adapter le résultat pour des tâches de traitement du langage naturel telles que la classification, le résumé et la génération, vous pouvez ajuster le modèle de base. Si vous souhaitez tester la qualité de votre message, vous pouvez l'évaluer à l'aide de mesures d'IA générative. Pour les deux tâches, vous devez fournir un ensemble d'exemples validés d'entrée et de sortie d'invite. Si vos données contiennent des informations sensibles, telles que des informations personnelles identifiables (IPI), assurez-vous de connaître la politique de votre organisation en matière d'IPI. Par exemple, vous pouvez avoir besoin de masquer des IPI ou de générer des données synthétiques pour ajuster ou tester votre modèle de base.
Connaissances ou compétences
Fournir des ensembles de données qui alimentent le modèle de base. Vous pouvez utiliser IntructLab pour améliorer un modèle de base existant avec les fonctionnalités nécessaires à votre cas d'utilisation. Vous fournissez des exemples de base ou des données de base qui servent de base à la génération de données synthétiques pour l'ajustement de l'instruction du modèle de base.

Plus d'informations sur la préparation des données pour l'IA générique

Comment évaluer la qualité et réduire les risques

Vous devez décider comment mesurer la qualité et assurer la sécurité.

Évaluation
Vous pouvez évaluer les performances de la solution et les risques par rapport à des mesures standard. Ces paramètres vous aident à vous assurer que les solutions d'IA sont exemptes de préjugés, qu'elles peuvent être facilement expliquées et comprises par les utilisateurs professionnels et qu'elles sont vérifiables dans les transactions commerciales.
Vous pouvez mesurer la précision textuelle, la similarité et la qualité des résultats du modèle de fondation. Vous pouvez également évaluer l'équité, la performance et la dérive des résultats du modèle. Vous pouvez évaluer les performances de plusieurs actifs simultanément et consulter des analyses comparatives des résultats pour identifier les meilleures solutions.
Vous pouvez contrôler les résultats du déploiement de vos modèles d'apprentissage automatique en termes d'équité, de qualité, de dérive et d'explicabilité.
Evaluation des risques
Vous pouvez identifier les risques potentiels en remplissant un questionnaire d'évaluation des risques.
Glissières de sécurité
Vous pouvez activer les garde-fous pour supprimer le contenu potentiellement dangereux ou le contenu PII du texte d'entrée et de sortie dans les invites.
Tests
Envisager la mise en place d'une équipe rouge pour simuler des attaques adverses.

Plus d'informations sur l'évaluation de la qualité et l'atténuation des risques

Comment optimiser et gérer les modèles de fondation

Vous pouvez optimiser un modèle de base en termes de précision, de coût, de latence d'inférence et de contrôle du cycle de vie du modèle.

Optimisation par défaut
IBM propose un ensemble de modèles de base qui sont déployés sur du matériel multi-tenant. Vous payez l'inférence par jeton. IBM contrôle le cycle de vie des modèles en les mettant à jour et en les supprimant. Lorsqu'un modèle est obsolète, vous devez mettre à jour votre solution pour inférer la nouvelle version du modèle ou un modèle différent.
Optimiser la précision et les coûts
Si vous souhaitez améliorer la précision de votre invite et réduire les coûts en déduisant un modèle de base plus petit, vous pouvez accorder un modèle de base fourni. Vous déployez un modèle adapté sur du matériel multilocataire et payez l'inférence par jeton.
Optimiser la précision et le contrôle
Si vous avez formé ou ajusté un modèle en dehors de watsonx.ai pour votre cas d'utilisation, vous pouvez importer et déployer un modèle personnalisé. Vous déployez le modèle sur du matériel dédié. Vous payez à l'heure pour l'hébergement du modèle et non pour l'inférence. Vous contrôlez le cycle de vie du modèle.
Optimiser la latence et le contrôle
Si votre solution doit prendre en charge un grand nombre d'utilisateurs simultanés, vous pouvez déployer un modèle de déploiement à la demande fourni par IBM sur du matériel dédié. Le matériel dédié offre une latence plus faible que le matériel multi-locataires. Vous payez à l'heure pour l'hébergement du modèle et non pour l'inférence. Vous contrôlez le cycle de vie du modèle.

Plus d'informations sur l'optimisation et la gestion des modèles de fondation

Comment fournir et maintenir votre solution

Vous devez décider comment fournir votre solution d'IA générique et contribuer à garantir sa qualité continue.

Déployer votre solution
Vous déployez votre ressource d'IA dans un espace de déploiement et récupérez ensuite le point de terminaison du déploiement pour invoquer votre solution d'IA dans votre application.
Pour l'inférence d'un modèle de base, le point final de l'inférence du modèle peut se trouver dans un extrait de code, une fonction Python, un service d'IA ou un code développé par votre équipe.
Pour une solution d'apprentissage automatique, le point d'arrivée peut être un modèle d'apprentissage automatique, une fonction Python, une application R Shiny, un modèle NLP ou un script.
Gérer ModelOps avec des espaces de déploiement
Vous pouvez prendre en charge un flux ModelOps en créant des espaces de déploiement distincts pour les versions de test, de préparation et de production de votre solution. Vous pouvez gérer l'accès à votre solution de production en ajoutant les collaborateurs appropriés à chaque espace.
Orchestrer les pipelines de ML
Vous pouvez assembler et configurer un pipeline pour créer, former, déployer et mettre à jour des modèles d'apprentissage automatique et des scripts Python.
Monitoring
Comme pour l'évaluation de votre solution au cours de son développement, vous pouvez contrôler les performances de la solution et les risques, tels que l'équité, la qualité et l'explicabilité. Vous pouvez visualiser les tendances dans le temps et définir des seuils pour vous alerter en cas de baisse des performances.
Commentaires des utilisateurs
Envisagez de mettre en place un mécanisme de retour d'information de la part des utilisateurs et de créer un processus pour recueillir ce retour d'information et améliorer votre solution en conséquence.
Par exemple, si vous mettez en œuvre un modèle RAG, vous pouvez ajouter un mécanisme de retour d'information permettant aux utilisateurs d'évaluer les réponses à leurs questions. Vous pouvez mettre en place un processus d'évaluation des réponses incorrectes et inadéquates et soit adapter le modèle RAG, soit adapter votre contenu pour fournir de meilleures réponses.

Plus d'informations sur la livraison et la maintenance

En savoir plus

Sujet parent : Planifier une solution d'IA générative