0 / 0
Retourner à la version anglaise de la documentation
Gestion des données pour les évaluations de modèle
Dernière mise à jour : 25 oct. 2024
Gestion des données pour les évaluations de modèle

Pour permettre l'évaluation des modèles, vous devez préparer vos données à l'enregistrement afin de générer des informations.

Vous devez fournir vos données de modèle dans un format pris en charge pour activer les évaluations de modèle. Vos transactions de modèle sont traitées et consignées dans le magasin de données. Le magasin de données est la base de données de journalisation qui stocke les données utilisées pour les évaluations de modèle. Les sections suivantes décrivent les différents types de données consignées pour les évaluations de modèle:

Données de formation

Vous devez fournir des données d'entraînement pour générer les statistiques dont vous avez besoin pour configurer les évaluations de modèle. Les données d'entraînement contiennent des colonnes de caractéristiques étiquetées qui sont mesurées pour déterminer leur impact sur les résultats du modèle et une colonne de prédiction qui contient le résultat que le modèle est entraîné à prédire. L'exemple suivant illustre les données d'apprentissage du jeu de données German Credit Risk:

Fichier CSV de données d'entraînement

Pour permettre l'évaluation des modèles, vous devez connecter vos données d'entraînement. Les données d'entraînement pour votre modèle doivent être fournies dans un format qui peut être traité. Pour plus d'informations, voir Gestion des données d'entraînement.

Données de contenu

Les données de contenu contiennent les transactions d'entrée et de sortie pour votre déploiement. Pour configurer les évaluations, les données de contenu de votre modèle sont stockées dans une table de journalisation de contenu utile. La table de journalisation de contenu utile contient les colonnes de fonction et de prévision qui existent dans vos données d'apprentissage et une colonne de probabilité de prévision qui contient la confiance du modèle dans la prévision qu'elle fournit. Le tableau inclut également des colonnes d'horodatage et d'ID pour identifier chaque demande d'évaluation que vous envoyez au service que vous utilisez, comme illustré dans l'exemple suivant:

Exemple de sortie du SDK Python de la table de journalisation de contenu utile

Vous devez envoyer des demandes d'évaluation pour fournir un journal de vos transactions de modèle. Pour plus d'informations, voir Gestion des données de contenu.

Données de commentaire

Les données de retour sont des données libellées qui correspondent à la structure des données d'apprentissage et incluent des résultats de modèle connus qui sont comparés aux prévisions de votre modèle pour mesurer l'exactitude de votre modèle. Vous devez télécharger régulièrement des données de retour afin de mesurer en permanence la précision des prédictions de votre modèle. Pour plus d'informations, voir Gestion des données de retour.

En savoir plus

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus