0 / 0
Volver a la versión inglesa de la documentación
Evaluaciones de desviación v2
Última actualización: 22 nov 2024
Evaluaciones de desviación v2

Distancia coseno

La distancia coseno mide la diferencia entre los vectores incrustados. Para medir la distancia coseno se utiliza la siguiente fórmula:

Aparece la fórmula de la distancia coseno

Se muestra la descripción de la fórmula de la distancia coseno

La distancia coseno oscila entre 0, que indica vectores idénticos, 1, que indica ausencia de correlación entre los vectores, y 2, que indica vectores opuestos.

Distancia euclídea

La distancia euclídea es la distancia más corta entre vectores incrustados en el espacio euclídeo. Para medir la distancia euclidiana se utiliza la siguiente fórmula:

Aparece la fórmula de la distancia euclidiana

Se muestra la descripción de la fórmula de la distancia euclídea

La distancia euclídea oscila entre 0, que indica vectores completamente idénticos, e infinito. Sin embargo, para vectores normalizados para tener longitud unitaria, la distancia euclídea máxima es la aparece el símbolo de la fórmula de la distancia euclidiana.

Puede configurar evaluaciones de desviación v2 para medir los cambios en los datos a lo largo del tiempo para garantizar resultados coherentes para el modelo. Utilice las evaluaciones de desviación v2 para identificar los cambios en la salida del modelo, la precisión de las predicciones y la distribución de los datos de entrada.

En las secciones siguientes se describe cómo configurar evaluaciones de desviación v2 :

Configuración de evaluaciones de desviación v2

Si registra los datos de la carga útil cuando se prepara para las evaluaciones del modelo, puede configurar las evaluaciones drift v2 para que le ayuden a comprender cómo los cambios en sus datos afectan a los resultados del modelo.

Calcular el archivo de desviación

Debe elegir el método que se utilizará para analizar sus datos de entrenamiento para determinar las distribuciones de datos de las características de su modelo. Si conecta datos de entrenamiento y el tamaño de su es inferior a 500 MB, puede optar por calcular el archivo drift v2.

Si no conecta sus datos de entrenamiento, o si el tamaño de sus datos es superior a 500 MB, debe elegir calcular el archivo drift v2 en un cuaderno. También debe calcular el archivo drift v2 en cuadernos si desea evaluar modelos de imagen o texto.

Puede especificar un límite para el tamaño de sus datos de entrenamiento estableciendo tamaños de muestra máximos para la cantidad de datos de entrenamiento que se utilizan para la puntuación y el cálculo del archivo drift v2. Para las implantaciones non-watsonx.ai Runtime, el cálculo del archivo drift v2 tiene un coste asociado a la puntuación de los datos de entrenamiento con respecto al punto final de puntuación de su modelo.

Establecer umbrales de desviación

Debe establecer valores umbral para cada métrica a fin de identificar problemas con los resultados de su evaluación. Los valores que establezca crean alertas en el panel de control de Insights que aparecen cuando las puntuaciones de métrica infringen los umbrales. Debe establecer los valores entre el rango de 0 a 1. Las puntuaciones de métrica deben ser inferiores a los valores de umbral para evitar infracciones.

Seleccionar características importantes

Sólo para modelos tabulares, la importancia de las características se calcula para determinar el impacto de la desviación de las características en su modelo. Para calcular la importancia de las características, puede seleccionar las características importantes y más importantes de su modelo que tengan el mayor impacto en los resultados del mismo.

Al configurar las explicaciones SHAP, las características importantes se detectan automáticamente mediante explicaciones globales.

También puede cargar una lista de características importantes cargando un archivo JSON. Se proporcionan fragmentos de ejemplo que puede utilizar para cargar un archivo JSON. Para obtener más información, consulte Fragmentos de código de importancia de característica.

Establecer tamaño de muestra

Se proporcionan tamaños de muestra para procesar el número de transacciones que se evalúan durante las evaluaciones. Debe establecer un tamaño mínimo de muestra para indicar el menor número de transacciones que desea evaluar. También puede establecer un tamaño máximo de muestra para indicar el número máximo de transacciones que desea evaluar.

Métricas de desviación soportadas v2

Cuando activa las evaluaciones drift v2, puede ver un resumen de los resultados de la evaluación con métricas para el tipo de modelo que está evaluando.

Puede consultar los resultados de sus evaluaciones drift v2 en el panel Insights. Para más información, consulte Revisión de los resultados de drift v2.

Las siguientes métricas están soportadas por las evaluaciones de desviación v2 :

Desviación de salida

La deriva de salida mide el cambio en la distribución de confianza del modelo.

  • Cómo funciona
    Se mide la cantidad que cambia la salida de su modelo desde el momento en que entrena el modelo. Para los modelos de regresión, la deriva de salida se calcula midiendo el cambio en la distribución de las predicciones sobre los datos de entrenamiento y de carga útil. Para los modelos de clasificación, la deriva de salida se calcula para cada probabilidad de clase midiendo el cambio en la distribución de las probabilidades de clase en los datos de entrenamiento y de carga útil. En los modelos de clasificación múltiple, la deriva de salida se agrega para cada probabilidad de clase midiendo una media ponderada.

  • Haz las cuentas
    Para calcular la deriva de salida se utilizan las siguientes fórmulas:

Desviación en la calidad del modelo

La desviación de la calidad del modelo compara la precisión estimada en tiempo de ejecución con la precisión de entrenamiento para medir la caída de la precisión.

  • Cómo funciona:

Se construye un modelo de detección de deriva que procesa sus datos de carga útil cuando configura las evaluaciones de deriva v2 para predecir si su modelo genera predicciones precisas sin la verdad del terreno. El modelo de detección de desviación utiliza las características de entrada y las probabilidades de clase del modelo para crear sus propias características de entrada.

  • Realizar las matemáticas:

Para calcular la deriva de calidad del modelo se utiliza la siguiente fórmula:

se muestra la fórmula de deriva de la calidad del modelo

La precisión de su modelo se calcula como el base_accuracy midiendo la fracción de transacciones predichas correctamente en sus datos de entrenamiento. Durante las evaluaciones, las transacciones se puntúan con respecto al modelo de detección de desviación para medir la cantidad de transacciones que probablemente predice correctamente el modelo. Estas transacciones se comparan con el número total de transacciones procesadas para calcular el predicted_accuracy. Si el predicted_accuracy es menor que el base_accuracy, se genera una puntuación de deriva de calidad del modelo.

Desviación de características

La deriva de características mide el cambio en la distribución de valores de las características importantes.

  • Cómo funciona:

La deriva se calcula para características categóricas y numéricas midiendo la distribución de probabilidad de valores continuos y discretos. Para identificar los valores discretos de las características numéricas, se utiliza un logaritmo binario para comparar el número de valores distintos de cada característica con el número total de valores de cada característica. Para identificar características numéricas discretas se utiliza la siguiente fórmula de logaritmo binario:

Se muestra la fórmula de logaritmo binario

Si distinct_values_count es menor que el logaritmo binario de total_count, la característica se identifica como discreta.

  • Realizar las matemáticas:

Para calcular la deriva de las características se utilizan las siguientes fórmulas:

Las fórmulas siguientes se utilizan para calcular las métricas de evaluación de desviación v2 :

Distancia de variación total

La distancia total de variación mide la diferencia máxima entre las probabilidades que dos distribuciones de probabilidad, línea base (B) y producción (P), asignan a la misma transacción como se muestra en la fórmula siguiente:

Se muestra la fórmula de distribución de probabilidad

Si las dos distribuciones son iguales, la distancia de variación total entre ellas se convierte en 0.

La siguiente fórmula se utiliza para calcular la distancia total de variación:

Se muestra la fórmula de distancia de variación total

  • 𝑥 es una serie de muestras equidistantes que abarcan el dominio de Se visualiza circunflejo f que van desde el mínimo combinado de los datos de referencia y producción hasta el máximo combinado de los datos de referencia y producción.

  • Se visualiza el símbolo d (x) es la diferencia entre dos muestras 𝑥 consecutivas.

  • explicación de la fórmula es el valor de la función de densidad para los datos de producción en una muestra 𝑥.

  • explicación de la fórmula es el valor de la función de densidad para los datos de referencia para en una muestra 𝑥.

El explicación de la fórmula denominador representa el área total bajo los gráficos de la función de densidad para los datos de producción y de referencia. Estas sumaciones son una aproximación de las integraciones sobre el espacio de dominio y ambos términos deben ser 1 y el total debe ser 2.

Coeficiente de solapamiento

El coeficiente de solapamiento se calcula midiendo el área total de la intersección entre dos distribuciones de probabilidad. Para medir la disimilaridad entre distribuciones, la intersección o el área de solapamiento se resta de 1 para calcular la cantidad de desviación. La fórmula siguiente se utiliza para calcular el coeficiente de solapamiento:

Se visualiza la fórmula de coeficiente de solapamiento

  • 𝑥 es una serie de muestras equidistantes que abarcan el dominio de Se visualiza circunflejo f que van desde el mínimo combinado de los datos de referencia y producción hasta el máximo combinado de los datos de referencia y producción.

  • Se visualiza el símbolo d (x) es la diferencia entre dos muestras 𝑥 consecutivas.

  • explicación de la fórmula es el valor de la función de densidad para los datos de producción en una muestra 𝑥.

  • explicación de la fórmula es el valor de la función de densidad para los datos de referencia para en una muestra 𝑥.

Distancia de Jensen Shannon

Jensen Shannon Distance es la forma normalizada de Kullback-Leibler (KL) Divergence que mide cuánto una distribución de probabilidad difiere de la segunda distribución de probabilidad. Jensen Shannon Distance es una puntuación simétrica y siempre tiene un valor finito.

La siguiente fórmula se utiliza para calcular la distancia de Jensen Shannon para dos distribuciones de probabilidad, línea base (B) y producción (P):

Se muestra la fórmula de distancia de Jensen Shannon

Se muestra la divergencia de KL es la Divergencia KL.

Tema padre: Configuración de evaluaciones de modelo

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información