Modèle de solution pour répondre aux questions avec génération augmentée par récupération
Dernière mise à jour : 07 mars 2025
Modèle de solution pour répondre aux questions avec génération augmentée par récupération
Vous pouvez créer une solution d'IA générative qui répond aux questions des utilisateurs en se basant sur les informations d'une base de connaissances en appliquant le modèle de génération augmentée par récupération (RAG).
Cas d'utilisation et exigences
Copy link to section
Le modèle RAG est utile lorsque vous avez besoin d'un modèle de base pour compléter les réponses aux questions avec les informations que vous fournissez. Par exemple, supposons que vous souhaitiez mettre en place un agent conversationnel pour votre nouveau produit, qui réponde aux questions en se basant sur la documentation de votre produit.
Une solution RAG qui répond aux questions à partir de la documentation produit peut inclure les tâches suivantes :
Trouver la réponse à la question de l'utilisateur dans la documentation du produit.
Générer des réponses basées sur la documentation du produit.
Lien vers les rubriques de la documentation qui ont fourni la réponse.
Conservez toutes les questions et réponses.
Recueillir les commentaires des utilisateurs sur les réponses.
Transmettre les commentaires négatifs aux rédacteurs de la documentation.
Architecture de solution
Copy link to section
Un modèle RAG comprend généralement les éléments suivants :
Une base de connaissances qui contient les documents sources.
Un modèle d'incorporation qui convertit le texte des documents en incorporations vectorielles, qui sont des représentations numériques.
Une base de données vectorielle qui stocke les vecteurs d'incorporation de vos documents et l'index vectoriel qui recherche et récupère le contenu.
Un modèle rapide qui combine la question de l'utilisateur, le contenu récupéré et les instructions pour générer une réponse.
Modèle de base qui génère une réponse à la question d'un utilisateur en fonction du contenu récupéré.
La solution complète pourrait également inclure les composants suivants :
Application dotée d'une interface utilisateur permettant aux utilisateurs de poser des questions, de recevoir des réponses et de donner leur avis sur les réponses.
Un modèle de reclassement qui réorganise les résultats obtenus en fonction de leur pertinence par rapport à la question, et non de leur similitude avec la question.
Un journal des questions, réponses et commentaires des utilisateurs.
Une méthode de transmission du feedback aux rédacteurs de la documentation, qui peuvent mettre à jour la documentation afin que la solution génère de meilleures réponses.
Une méthode pour identifier les meilleurs experts pour répondre aux réponses insatisfaisantes.
Par exemple, le graphique suivant illustre comment vous pouvez optimiser votre solution RAG en adaptant votre contenu pour améliorer les réponses de l'IA en fonction des commentaires des utilisateurs.
Mise en œuvre de la solution
Copy link to section
Pour mettre en œuvre une solution de patronage RAG, suivez les principales étapes suivantes :
Mettre en place une base de données vectorielles.
Créer un index vectoriel.
Spécifiez l'index du vecteur dans l'invite.
Évaluez l'invite.
Ajouter des composants optionnels.
Déployer le modèle en tant que service d'IA.
Appelez le point de terminaison du service d'IA dans votre application.
Outils
Copy link to section
Vous pouvez créer une preuve de concept rapide dans l' Prompt Lab. Vous pouvez télécharger un fichier de document et créer un index vectoriel pour celui-ci dans le magasin vectoriel en mémoire. Voir Chatter avec des documents. Lorsque vous configurez une base de données vectorielles, vous pouvez créer un index vectoriel auquel vous pouvez faire référence dans une invite. Voir Ajout de documents vectorisés pour les invites du modèle de base de mise à la terre.
Vous pouvez démarrer rapidement votre solution RAG avec le Q&A avec l'accélérateur RAG. L'accélérateur est un exemple de projet qui met en œuvre un modèle RAG avec un ensemble de cahiers d' Python s que vous pouvez personnaliser pour votre solution. Voir Q&R avec l'accélérateur RAG.
Vous pouvez automatiser la recherche du meilleur modèle RAG, exécuter l'outil d' AutoAI s pour construire une solution RAG. AutoAI automatise le flux de bout en bout, de l'expérimentation au déploiement. Voir Automatiser un patron RAG avec l' AutoAI.
Vous pouvez ignorer l'interface utilisateur et écrire du code avec les API REST, les bibliothèques d' Python s ou les SDK d' Node.js. Voir le Hub développeur d' watsonx.