Détails du modèle AutoAI RAG
Une fois l'expérience AutoAI RAG terminée, consultez les détails d'un motif pour en comprendre la composition et les performances.
Présentation du modèle
À partir du tableau de classement du pipeline, vous pouvez consulter un tableau contenant les informations suivantes pour chacun des modèles générés par l'expérience :
Colonne | Descriptif |
---|---|
Rang | Classement du placement en fonction de la meilleure performance pour la métrique optimisée |
Nom | Nom du pattern |
Nom du modèle | Nom du modèle d'intégration utilisé pour vectoriser et indexer les documents |
Optimiser la métrique | Résultats de performance pour la métrique optimisée sélectionnée pour l'expérience. Un modèle RAG peut être optimisé pour la fidélité de la réponse et la justesse de la réponse |
Taille de bloc | Quantité de données extraites des documents indexés |
Méthode d'extraction | Méthode (Window ou Simple) utilisée pour récupérer les documents indexés |
Métrique de distance du magasin de vecteurs | Métrique (cosinus ou euclidienne) utilisée pour mesurer la pertinence des vecteurs stockés par rapport aux vecteurs d'entrée |
Détails du schéma
Cliquez sur le nom d'un modèle pour passer en revue les détails de configuration suivants pour un modèle. Pour comparer deux patrons, basculez sur Comparer les patrons et sélectionnez un patron à comparer. Certains paramètres de configuration sont modifiables lorsque vous créez l'expérience. Pour plus de détails, voir Personnalisation des paramètres de l'expérience RAG.
Informations sur le schéma
Colonne | Descriptif |
---|---|
Schéma | Nom du pattern |
Type de score | Comment la mesure de performance est calculée et présentée. - Moyenne : Le score moyen de la mesure. - IC haut : La limite supérieure de l'intervalle de confiance (IC) pour le score moyen, indiquant la valeur la plus élevée que la mesure est susceptible d'atteindre. - IC bas : La limite inférieure de l'intervalle de confiance (IC) pour le score moyen, indiquant la valeur la plus faible que la mesure est susceptible d'atteindre. |
Exactitude de la réponse | L'exactitude de la réponse générée, qui comprend à la fois la pertinence du contexte extrait et la qualité de la réponse générée. |
Fidélité de la réponse | Précision de la réponse générée par rapport au texte extrait. |
Exactitude du contexte | Pertinence de la réponse générée par rapport à l'entrée. |
Magasin de vecteurs
Colonne | Descriptif |
---|---|
Type de source de données du magasin de vecteurs | Source de données qui se connecte au magasin de vecteurs. |
Métrique de distance du magasin de vecteurs | Métrique utilisée pour mesurer la pertinence des vecteurs stockés par rapport au vecteur d'entrée. |
Nom de l'index du magasin de vecteurs | Index utilisé comme structure de données pour le stockage et l'extraction de magasins de vecteurs. |
Fonctionnement du magasin de vecteurs | Opération de stockage vectoriel pour récupérer des données. Par exemple, upsert pour insérer ou mettre à jour des lignes dans la table de la base de données. |
Zones de schéma du magasin de vecteurs | Schéma pour le stockage de l'index des documents vectorisés. |
ID du schéma du magasin vectoriel | Identifiant unique du schéma de stockage vectoriel. |
Nom du schéma de magasin de vecteurs | Nom du schéma utilisé pour structurer la table de la base de données |
Type de schéma de magasin de vecteurs | Détermine le type de données qui peuvent être stockées dans le schéma et les opérations qui peuvent être effectuées sur les données. Le type de schéma struct est utilisé pour stocker des données structurées. |
Segmentation
Colonne | Descriptif |
---|---|
Chevauchement de blocs | Nombre de blocs qui partagent des mots ou des phrases communs. |
Taille de bloc | Quantité de données extraites des documents de l'index. |
Augmentation de bloc | Comment le texte pertinent est extrait pour chaque bloc de l'entrée après la division de l'entrée en plusieurs blocs. |
Intégrations
Colonne | Descriptif |
---|---|
Modèle d'intégration | Modèle d'intégration utilisé pour vectoriser et indexer la collection de documents. |
Tronquer les jetons d'entrée | Nombre maximal de jetons acceptés en entrée. |
Tronquer la stratégie | Stratégie utilisée pour déterminer comment traiter les documents extraits afin d'optimiser les performances du modèle. |
Extraction
Colonne | Descriptif |
---|---|
Méthode d'extraction | Méthode utilisée pour extraire les documents indexés : fenêtre ou simple. |
Nombre de blocs | Nombre de blocs extraits des documents indexés. |
Taille de la fenêtre | Nombre de jetons adjacents pris en compte par le modèle lors de l'extraction de texte à partir de documents indexés. |
Génération
Colonne | Descriptif |
---|---|
Texte du modèle contextuel | Modèle structuré pour la réponse générée. |
Modèle de base | Modèle de fondation utilisé dans l'expérimentation. Cliquez sur l'icône de prévisualisation pour obtenir des détails sur le modèle. |
Méthode de décodage | Processus qu'un modèle utilise pour choisir les jetons dans la sortie générée. |
Nombre maximum de nouveaux jetons | Nombre maximal de nouveaux jetons pouvant être générés en plus des jetons extraits des documents indexés. |
Nombre minimum de nouveaux jetons | Nombre minimum de nouveaux jetons pouvant être générés. |
Texte du modèle d'invite | Structure avec des lignes directrices pour le modèle à utiliser lors de l'extraction de texte à partir de documents indexés. |
Rapport mot/jeton | Nombre de mots dans un texte divisé par le nombre de tokens générés. |
Exemples de questions et réponses
Colonne | Descriptif |
---|---|
Exemples de questions et réponses | Les questions et les réponses correctes sont fournies comme données de test pour mesurer la performance du modèle. Exemple : ![]() |
Sujet parent : Automatisation d'un modèle RAG avec AutoAI