0 / 0
Retourner à la version anglaise de la documentation
Métrique d'évaluation de la dérive des métadonnées de sortie
Dernière mise à jour : 04 mars 2025
Métrique d'évaluation de la dérive des métadonnées de sortie

La métrique de dérive des métadonnées de sortie mesure le changement dans la distribution des métadonnées de texte de sortie LLM.

Détails de l'indicateur

La dérive des métadonnées de sortie est une mesure d'évaluation de la dérive de l' v2, qui peut aider à mesurer les changements de vos données au fil du temps afin de garantir des résultats cohérents pour votre modèle.

Les types suivants de métadonnées textuelles de sortie LLM sont mesurés avec la dérive des métadonnées de sortie :

Nombre de caractères : nombre total de caractères dans le texte de sortie
Nombre de mots : Nombre total de mots dans le texte de sortie
Nombre de jetons : nombre total de jetons dans le texte de sortie
Nombre de phrases : nombre total de phrases dans le texte de sortie
Longueur moyenne des mots : Longueur moyenne des mots dans le texte de sortie
Longueur totale des mots : Longueur totale des mots dans le texte de sortie
Longueur moyenne des phrases : Longueur moyenne des phrases dans le texte de sortie

Portée

La dérive des métadonnées de sortie n'évalue que les ressources d'IA générative.

  • Types d'actifs IA : modèles de messages
  • Tâches d'IA générative :
    • Synthèse de texte
    • Classification de texte
    • Génération de contenu
    • Réponse aux questions
  • Langues prises en charge : anglais

Scores et valeurs

Le score de dérive des métadonnées de sortie indique le changement dans la distribution des métadonnées textuelles de sortie du LLM.

  • Plage de valeurs : 0.0-1.0
  • Meilleur score possible : 0.0
  • Ratios :
    • À 0 : Aucun changement n'est détecté.
    • Plus de 0 : un changement croissant est détecté.

Processus d'évaluation

Watsonx.governance calcule la dérive des métadonnées de sortie en mesurant le changement dans la distribution des colonnes de métadonnées. La colonne du nombre de jetons de sortie, si elle est présente dans la charge utile, est également utilisée pour calculer la dérive des métadonnées de sortie. Vous pouvez également choisir de spécifier des méta-champs lors de l'ajout d'enregistrements dans la table de données utiles. Ces méta-champs sont également utilisés pour calculer la dérive des métadonnées de sortie.

Calculs

La formule de logarithme binaire suivante est utilisée pour identifier les colonnes de métadonnées de sortie numériques discrètes :

La formule du logarithme binaire s'affiche

If the `distinct_values_count` is less than the binary logarithm of the `total_count`, the feature is identified as discrete.

For discrete output metadata columns, watsonx.governance uses the [Jensen Shannon distance](#jensen-shannon-distance) formula to calculate output metadata drift.

For continuous output metadata columns, watsonx.governance uses the [total variation distance](#total-variation-distance) and [overlap coefficient](#overlap-coefficient) formulas to calculate output metadata drift: 

La formule de distance de Jensen-Shannon suivante est utilisée pour calculer la dérive des métadonnées de sortie pour les colonnes de métadonnées de sortie discrètes :

La formule de Jensen-Shannon est affichée

La distance de Jensen-Shannon est la forme normalisée de la divergence de Kullback-Leibler (KL) qui mesure à quel point une distribution de probabilité diffère de la seconde distribution de probabilité. Jensen Shannon Distance est un score symétrique et a toujours une valeur finie.

KL Divergence s'affiche est la divergence KL.

Les formules de distance de variation totale et de coefficient de chevauchement sont utilisées pour calculer la dérive des métadonnées de sortie pour les colonnes de métadonnées de sortie continues.

La distance de variation totale mesure la différence maximale entre les probabilités que deux distributions de probabilités, de référence (B) et de production (P), attribuent à la même transaction, comme indiqué dans la formule suivante :

La formule de distribution de probabilité s'affiche

Si les deux distributions sont égales, la distance de variation totale entre elles devient 0.

La formule suivante est utilisée pour calculer la distance de variation totale :

La formule de la distance de variation totale est affichée

  • 𝑥 est une série d'échantillons équidistants qui couvrent le domaine de l' circumflex f est affiché , allant du minimum combiné des données de référence et de production au maximum combiné des données de référence et de production.

  • d(x) s'affiche est la différence entre deux échantillons 𝑥 consécutifs.

  • explication de la formule est la valeur de la fonction de densité pour les données de production à un échantillon 𝑥.

  • explication de la formule est la valeur de la fonction de densité pour les données de base pour un échantillon à 𝑥.

Le dénominateur « explication de la formule » représente la surface totale sous les courbes de la fonction de densité pour les données de production et de référence. Ces sommes sont une approximation des intégrales sur l'espace des domaines et ces deux termes devraient être égaux à 1 et le total devrait être égal à 2.

Le coefficient de recouvrement est calculé en mesurant la surface totale de l'intersection entre deux distributions de probabilité. Pour mesurer la dissemblance entre les distributions, l'intersection ou la zone de chevauchement est soustraite de 1 pour calculer le degré de dérive. La formule suivante est utilisée pour calculer le coefficient de chevauchement :

La formule du coefficient de recouvrement est affichée

  • 𝑥 est une série d'échantillons équidistants qui couvrent le domaine de l' circumflex f est affiché , allant du minimum combiné des données de référence et de production au maximum combiné des données de référence et de production.

  • d(x) s'affiche est la différence entre deux échantillons 𝑥 consécutifs.

  • explication de la formule est la valeur de la fonction de densité pour les données de production à un échantillon 𝑥.

  • explication de la formule est la valeur de la fonction de densité pour les données de base pour un échantillon à 𝑥.

Sujet parent : Indicateurs d'évaluation