Opciones de eliminación de sesgo

Watson OpenScale utiliza dos tipos de eliminación del sesgo: pasivo y activo. La eliminación pasiva del sesgo revela cómo se ha eliminado el sesgo, mientras que la eliminación activa del sesgo le impide continuar con el sesgo cambiando el modelo en tiempo real para la aplicación actual. Además del sesgo directo, Watson OpenScale puede determinar el sesgo indirecto.

 

Eliminación pasiva del sesgo

La eliminación pasiva del sesgo es el trabajo que realiza automáticamente Watson OpenScale por su cuenta, cada hora. Se considera pasiva porque se lleva a cabo sin la interacción del usuario. Cuando Watson OpenScale comprueba el sesgo, también realiza una eliminación de sesgo en los datos. Analiza el comportamiento del modelo e identifica los datos en los que el modelo actúa de forma sesgada.

A continuación, Watson OpenScale crea un modelo de aprendizaje de máquina para pronosticar si es probable que el modelo actúe de forma sesgada en un nuevo punto de datos específico. A continuación, Watson OpenScale, a analiza los datos que recibe el modelo, cada hora, y busca los puntos de datos que causan el sesgo. Para estos puntos de datos, el atributo de equidad se perturba de minoría a mayoría, y los datos perturbados se envían al modelo original para la predicción. Esta predicción del modelo original se utiliza como la salida sin sesgo.

Watson OpenScale elimina el sesgo de todos los datos que ha recibido el modelo durante la última hora. También calcula la equidad de la salida sin sesgo y la muestra en la pestaña Modelo sin sesgo.

Eliminación activa del sesgo

La eliminación activa del sesgo es una manera de solicitar e incorporar los resultados sin sesgo a la aplicación mediante el punto final de la API REST. Indica activamente a Watson OpenScale que ejecute la eliminación del sesgo y modifique el modelo para que se pueda ejecutar la aplicación sin sesgo. En la eliminación activa del sesgo, puede utilizar un punto final de API REST de eliminación de sesgo desde su aplicación. Este punto final de API REST invocará inmediatamente su modelo y comprobará su comportamiento.

Si Watson OpenScale detecta que el modelo actúa de forma sesgada, perturba los datos y los envía de nuevo al modelo original. La salida del modelo original en los datos perturbados se devuelve como la predicción no sesgada. Si Watson OpenScale determina que el modelo original no actúa de forma sesgada, Watson OpenScale devolverá la predicción del modelo original como la predicción no sesgada. De este modo, si utiliza este punto final de API REST, puede asegurarse de que la aplicación no toma decisiones sobre la salida sesgada.

Pasos para seleccionar el enlace de punto final de puntuación sin sesgo

  1. En la ventana Evaluaciones, pulse Configurar supervisores.
  2. En el panel de navegación, pulse Puntos finales.
  3. En el panel Información, pulse el separador Puntos finales.
  4. En la lista Punto final, pulse Transacciones sin sesgo.
  5. En la lista Lenguaje de código, seleccione el tipo de código: cURL, Java o Python.
  6. Para copiar el fragmento de código, pulse Copiar en portapapeles Se muestra el icono Copiar en portapapeles..

Visualización de los resultados de equidad para sesgo indirecto

Después de asegurarse de que el modelo esté configurado para el análisis de sesgo indirecto, puede ver los resultados del análisis:

Se muestra el sesgo indirecto

Las características correlacionadas comienzan a estar colapsadas. La fuerza de la correlación se presenta siguiendo la característica. La ayuda contextual describe las características del proxy. Se muestran las tres características más relevantes. Expanda cada característica para ver los valores para los tres grupos supervisados más bajos y tres grupos de referencia más altos. Para cada grupo, se muestran los tres valores más frecuentes y el número de resultados favorables para esta clase.

Próximos pasos

  • Para mitigar el sesgo, debe crear una nueva versión del modelo que corrija el problema. Watson OpenScale almacena registros sesgados en la tabla de etiquetado manual. Es necesario etiquetar manualmente estos registros sesgados y a continuación volver a entrenar el modelo utilizando estos datos adicionales para crear una nueva versión del modelo sin sesgo.
  • También puede extraer una lista de los registros sesgados individuales a través de la tabla de etiquetado manual. Conéctese a la tabla de etiquetado manual y lea los registros utilizando consultas SQL estándar.