Cuando habilita las evaluaciones de calidad en Watson OpenScale, puede generar métricas que le ayuden a determinar el grado en que el modelo predice los resultados.
Puede ver los resultados de las evaluaciones de calidad en el panel de control de Insights en Watson OpenScale. Para ver los resultados, puede seleccionar un mosaico de despliegue de modelo y pulsar la flecha en la sección de evaluación Calidad para visualizar un resumen de las métricas de calidad de la última evaluación. Para obtener más información, consulte Revisión de resultados de calidad.
Las métricas de calidad se calculan con datos de comentarios etiquetados manualmente y respuestas de despliegue supervisadas. Para obtener más información, consulte Gestión de datos de comentarios.
Métricas de calidad soportadas
Watson OpenScale da soporte a las siguientes métricas de calidad:
Problemas de clasificación binaria
Para los modelos binarios, Watson OpenScale realiza un seguimiento cuando la calidad del modelo cae por debajo de un nivel aceptable. Para los modelos de clasificación binaria, comprueba la puntuación del Área bajo ROC, que mide la capacidad del modelo para distinguir entre dos clases. Por ejemplo, los modelos con puntuaciones del Área bajo ROC superiores son mejores para identificar la clase A como clase A y la clase B como clase B. Las métricas siguientes miden los problemas de la clasificación binaria:
Problemas de clasificación de regresión
Para los modelos de regresión, Watson OpenScale realiza un seguimiento cuando la calidad del modelo cae por debajo de un nivel aceptable y comprueba la puntuación R cuadrado . La puntuación R cuadrado mide la correlación entre los valores pronosticados y los valores reales. Por ejemplo, los modelos con puntuaciones R cuadrado más altas se ajustan mejor a los valores reales. Las métricas siguientes miden los problemas de la clasificación de regresión:
Problemas de clasificación de varias clases
Para modelos de clasificación múltiple, Watson OpenScale realiza un seguimiento cuando la calidad del modelo se encuentra bajo un nivel aceptable y comprueba la puntuación de Precisión que proporciona el porcentaje de predicciones precisas. Las medidas siguientes mide los problemas de clasificación de varias clases:
- Precisión
- Índice de verdaderos positivos ponderados (wTPR)
- Índice de falsos positivos ponderados (wFPR)
- Exhaustividad ponderada
- Precisión ponderada
- Medida F1 ponderada
- Pérdida logarítmica
Después de que Watson OpenScale detecte problemas de calidad, como por ejemplo las violaciones de umbral de precisión, debe crear una nueva versión del modelo que corrija el problema. Utilizando los datos etiquetados manualmente en la tabla de comentarios, debe volver a entrenar el modelo junto con los datos de entrenamiento originales.
Más información
Revisión de los resultados de la evaluación
Tema padre: Configuración de evaluaciones de calidad