Rubrique traduite automatiquement Vous pouvez passer à la version anglaiseVoir la clause de protection
Pour obtenir la version la plus précise et la plus à jour de cette documentation, voir la version anglaise (originale). IBM n'est pas responsable des dommages ou pertes résultant de l'utilisation du contenu traduit automatiquement (machine).
Exemples de bout en bout : Accélérateurs métier
Dernière mise à jour : 10 févr. 2025
Exemples de bout en bout : Accélérateurs métier
Les accélérateurs industriels fournis par IBM sont un ensemble de solutions de bout en bout que vous pouvez utiliser à titre d'exemple ou personnaliser pour répondre à des problèmes commerciaux courants.
Vue d'ensemble des accélérateurs métier
Copy link to section
Un accélérateur industriel est conçu pour vous aider à résoudre un problème commercial spécifique à l'aide d'une solution d'IA générative. Parcourez les accélérateurs dans le centre de ressources et créez ceux que vous souhaitez.
Un accélérateur consiste en un exemple de projet qui contient tout ce dont vous avez besoin pour construire une solution d'IA générique. L'exemple de projet peut inclure des données, des carnets Jupyter, des scripts, des tâches et des jeux de paramètres.
Présentation du processus
Copy link to section
Chaque accélérateur fournit des instructions détaillées. Ces étapes donnent un aperçu du processus
pour les exemples de projet :
Pour démarrer avec un accélérateur :
Accédez à l'exemple de projet dans le centre de ressources. Vous pouvez filtrer les échantillons dans le centre de ressources pour voir tous les projets ou les accélérateurs sectoriels.
Cliquez sur Créer un projet et suivez les étapes pour créer le projet.
Suivez les instructions pour exécuter les carnets et effectuer d'autres tâches.
Questions et réponses avec RAG Accelerator
Copy link to section
Essayez les questions-réponses avec l'accélérateur RAG pour mettre en place la génération augmentée par la recherche (RAG) afin de générer des résultats factuellement exacts, fondés sur des informations provenant des documents fournis. Vous devez être connecté à watsonx pour accéder à l'accélérateur dans le centre de ressources.
Les questions-réponses avec l'accélérateur RAG fournissent un modèle et une mise en œuvre avancés de RAG qui comprennent les processus suivants :
Traitement des documents : La conversion, le traitement et l'indexation des documents pour générer un index vectoriel.
Génération de réponses : Réponse aux questions par la génération d'une recherche augmentée basée sur les résultats de la recherche vectorielle.
Enregistrement des entrées/sorties : L'enregistrement des questions, des morceaux récupérés et des métadonnées, ainsi que des réponses dans un index secondaire.
Collecte des commentaires des utilisateurs : Les commentaires de l'utilisateur sont ajoutés aux entrées et sorties correspondantes du journal.
Analyse du contenu : Un rapport sur le contenu spécifique qui doit être amélioré pour améliorer les réponses qui ont reçu un retour négatif de la part des utilisateurs.
Intervention humaine : L'identification des meilleurs experts pour répondre aux réponses insatisfaisantes en utilisant un index vectoriel avec des profils d'experts.
Le graphique suivant montre comment les processus de Q&A avec RAG Accelerator sont cycliques, de sorte que le contenu du document est mis à jour en fonction du retour d'information de l'utilisateur.
Gestion des documents
Copy link to section
Un bloc-notes pour le traitement et l'indexation des documents automatise la conversion, la division et l'indexation des documents dans un index vectoriel dans l'une de ces bases de données vectorielles :
watsonx.data Milvus
watsonx Discovery avec Elastic Search Enterprise ou IBM Cloud Databases for Elasticsearch Platinum.
La collection de documents d'exemple à vectoriser est une version de cette documentation watsonx as a Service définie dans un fichier ZIP. Vous pouvez personnaliser le notebook pour exécuter des index vectoriels existants que vous avez créés en dehors de watsonx avec d'autres outils, par exemple, des connecteurs et des pipelines Elastic, des pipelines Spark ou vos propres processus.
Génération de réponses
Copy link to section
Le notebook de la fonction Python Q&A définit le code de la fonction Python et automatise son déploiement avec un suffixe URL bien défini dans un espace de déploiement. Les questions et réponses avec le code de fonction RAG Python sont configurées par des jeux de paramètres. La fonction prend une question en entrée et interroge l'index vectoriel pour récupérer les morceaux les plus pertinents pour répondre à la question ainsi que les métadonnées des morceaux, y compris les liens vers les documents sources. La fonction ajoute les morceaux les plus pertinents au modèle d'invite configuré et renvoie la réponse générée, le score de fidélité calculé et les morceaux récupérés avec les métadonnées.
Enregistrement des entrées/sorties
Copy link to section
Pour chaque appel de la fonction Python Q&A with RAG, vous pouvez activer l'enregistrement du texte d'entrée et de sortie de l'invite. Toutes les IPI sont supprimées des chaînes de caractères avant l'enregistrement. L'index des journaux est distinct de l'index vectoriel pour les documents de la base de données vectorielle.
Si l'enregistrement des entrées/sorties est actif, vous pouvez activer les suggestions de complétion de questions lorsque les utilisateurs saisissent leurs questions. Si l'utilisateur accepte une réponse basée sur une question à laquelle il a récemment répondu, la réponse est extraite de l'index du journal, ce qui permet de gagner du temps et de réduire les coûts d'inférence et d'extraction du GPU.
Collecte des commentaires des utilisateurs
Copy link to section
Le retour d'information des utilisateurs aide les parties prenantes à comprendre dans quelle mesure la solution fonctionne bien pour leurs utilisateurs, quels sont les sujets documentaires qui intéressent les utilisateurs et dans quelle mesure la solution répond aux questions basées sur le contenu. Vous pouvez configurer l'application pour qu'elle rappelle la fonction Python Q&A with RAG afin de recueillir les commentaires de l'utilisateur sur la réponse. Le retour d'information de l'utilisateur, composé d'une note de satisfaction et d'un commentaire facultatif, est ensuite annexé à l'enregistrement du journal des questions et réponses en vue d'une analyse ultérieure.
Analyse du contenu
Copy link to section
Vous pouvez configurer le carnet d'analyse du retour utilisateur et l'exécuter directement ou en tant que tâche. Le bloc-notes interroge les données du journal pour l'intervalle de temps spécifié ou les dates de début et de fin. Le bloc-notes charge les données du journal dans un cadre de données et utilise la détection non supervisée de sujets à partir de BERTopic ou du traitement du langage naturel de Watson pour déterminer quels sujets de documents ont été récupérés le plus fréquemment pour générer des réponses. Le carnet de notes analyse et visualise la satisfaction des utilisateurs par sujet, et inclut les questions, les réponses et les commentaires des utilisateurs pour les réponses mal notées. Sur la base de ces informations, les parties prenantes et les propriétaires de contenu de connaissances peuvent améliorer le contenu afin d'obtenir de meilleures réponses.
Intervention humaine
Copy link to section
Lorsqu'un utilisateur n'est pas satisfait d'une réponse, vous pouvez configurer l'application de manière à ce qu'elle recherche un contact expert susceptible de fournir une meilleure réponse. Vous pouvez configurer le bloc-notes de profilage d'experts pour qu'il traite les documents de profilage d'experts et construise un index sur la base de ces informations. Par exemple, l'application peut transmettre la question à l'expert, envoyer la réponse de l'expert à l'utilisateur et avertir le propriétaire de la base de connaissances d'une éventuelle amélioration du contenu.