Descripción general de las métricas de equidad

Utilice la supervisión de equidad de IBM Watson OpenScale para determinar si los resultados que genera el modelo son justos o no para el grupo supervisado. Cuando la supervisión de equidad está habilitada, de forma predeterminada genera un conjunto de métricas cada hora. Puede generar estas métricas bajo demanda pulsando el botón Comprobar equidad ahora o utilizando el cliente Python.

Watson OpenScale identifica automáticamente si algún atributo protegido conocido está presente en un modelo. Cuando Watson OpenScale detecta estos atributos, automáticamente recomienda configurar los supervisores de sesgo para cada atributo presente, a fin de garantizar que se realiza el seguimiento en producción del sesgo en estos atributos potencialmente sensibles.

Actualmente, Watson OpenScale detecta y recomienda supervisores para los siguientes atributos protegidos:

  • sexo
  • grupo étnico
  • estado civil
  • edad
  • código postal

Además de detectar los atributos protegidos, Watson OpenScale recomienda qué valores de cada atributo se deberían establecer como valores supervisados y cuáles como valores de referencia. Por ejemplo, Watson OpenScale recomienda que en el atributo Sexo, se configure el supervisor de sesgo de modo que los valores supervisados sean Mujer y No binario y el valor de referencia sea Hombre. Si desea cambiar alguna de las recomendaciones, puede editarlas mediante el panel de configuración de sesgo.

Los supervisores de sesgo recomendados ayudan a agilizar la configuración y garantizan que compruebe la equidad respecto a los atributos sensibles de sus modelos de inteligencia artificial. A medida que los reguladores prestan cada vez más atención al sesgo algorítmico, es cada vez más importante que las organizaciones comprendan el funcionamiento de sus modelos y si estos generan resultados injustos para determinados grupos.

Información sobre la equidad

Watson OpenScale comprueba si su modelo desplegado está sesgado en tiempo de ejecución. Para detectar sesgos en un modelo desplegado, debe definir atributos de equidad, como Edad o Sexo, tal como se detalla en la sección Configuración del supervisor de equidad.

Es obligatorio especificar el esquema de salida para un modelo o función en Machine Learning, a fin de que la comprobación de sesgo esté habilitada en Watson OpenScale. El esquema de salida se puede especificar utilizando la propiedad client.repository.ModelMetaNames.OUTPUT_DATA_SCHEMA en la parte de metadatos de la API store_model. Para obtener más información, consulte la Documentación del cliente de IBM Watson Machine Learning.

Cómo funciona

Antes de configurar el supervisor de equidad debe comprender algunos conceptos clave imprescindibles:

  • Los atributos de equidad son los atributos del modelo para los que este es probable que muestre un sesgo. Por ejemplo, para el atributo de equidad Sexo, el modelo podría estar sesgado para valores de sexo específicos, tales como Mujer o No binario. Otro ejemplo de atributo de equidad es Edad, donde el modelo podría estar sesgado para las personas de un grupo de edad, por ejemplo 18 a 25.

  • Valores de referencia y supervisados: los valores de los atributos de equidad se dividen en dos categorías distintas, Referencia y Supervisados. Los valores supervisados son aquellos para los que es probable que haya una discriminación. En el caso de un atributo de equidad como Sexo, los valores supervisados podrían ser Mujer y No binario. Para un atributo de equidad numérico, por ejemplo Edad, los valores supervisados podrían ser [18-25]. Todos los demás valores de un atributo de equidad determinado se considerarán valores de referencia, por ejemplo Sexo=Hombre o Edad=[26,100].

  • Resultados favorables y desfavorables: la salida del modelo se categoriza como Favorable o Desfavorable. Como ejemplo, si el modelo predice si una persona debe obtener o no un préstamo, la columna Favorable podría ser Préstamo otorgado o Préstamo otorgado parcialmente, mientras que el resultado Desfavorable podría ser Préstamo denegado. Por lo tanto, el resultado Favorable es uno que se considera positivo, mientras que el resultado Desfavorable se considera negativo.

El algoritmo de Watson OpenScale calcula el sesgo cada hora, utilizando los últimos N registros presentes en la tabla de registro de carga útil; el valor de N se especifica al configurar la equidad. El algoritmo perturba estos últimos N registros para generar datos adicionales.

La perturbación se realiza cambiando el valor del atributo de equidad de Referencia a Supervisado, o viceversa. A continuación, los datos perturbados se envían al modelo para evaluar su comportamiento. El algoritmo considera los últimos N registros de la tabla de carga útil, y el comportamiento del modelo en los datos perturbados, para decidir si el modelo actúa de manera sesgada.

Se considera que un modelo está sesgado si, en este conjunto de datos combinado, el porcentaje de resultados favorables de la clase supervisada es inferior al porcentaje de resultados favorables para la clase de referencia, por algún valor de umbral. Este valor de umbral se especificará al configurar la equidad.

Los valores de equidad no pueden ser superiores al 100%. Esto significa que el grupo supervisado ha recibido resultados más favorables que el grupo de referencia. Además, si no se envía ninguna solicitud de puntuación nueva, el valor de equidad se mantendrá constante.

Datos equilibrados y equidad perfecta

Para los conjuntos de datos equilibrados, se aplican los siguientes conceptos:

  • Para determinar el valor de equidad perfecto, las transacciones del grupo de referencia se sintetizan cambiando el valor de la característica supervisada de cada transacción del grupo supervisado en relación con todos los valores del grupo de referencia. Estas nuevas transacciones sintetizadas se añaden al conjunto de transacciones del grupo de referencia y el modelo las evalúa.

    Si la característica supervisada es SEX y el grupo supervisado es FEMALE, todas las transacciones FEMALE se duplican como transacciones MALE. Otros valores de características permanecen sin cambios. Estas nuevas transacciones de MALE sintetizadas se añaden al conjunto de transacciones del grupo de referencia MALE original.

  • Desde el nuevo grupo de referencia, se determina el porcentaje de resultados favorables. Este porcentaje representa la equidad perfecta para el grupo supervisado.
  • Las transacciones del grupo supervisado también se sintetizan cambiando el valor de la característica de referencia de cada transacción del grupo de referencia en relación con el valor del grupo supervisado. Estas nuevas transacciones sintetizadas se añaden al conjunto de transacciones del grupo supervisado y el modelo las evalúa.

Si la característica supervisada es SEX y el grupo supervisado es FEMALE, se duplican todas las transacciones MALE como transacciones FEMALE. Otros valores de características permanecen sin cambios. Estas nuevas transacciones FEMALE sintetizadas se añaden al conjunto de transacciones del grupo supervisado FEMALE original.

Cómo calcularlo

La métrica de equidad utilizada en Watson OpenScale tiene un impacto desigual, que es una medida de cómo se compara la tasa con la que un grupo sin privilegios recibe una salida o resultado determinado, con la tasa con la que el grupo con privilegios recibe el mismo resultado.

Se utiliza la fórmula matemática siguiente para calcular el impacto desigual:

                     (num_positives(privileged=False) / num_instances(privileged=False))
Disparate impact =   ______________________________________________________________________

                     (num_positives(privileged=True) / num_instances(privileged=True))

donde num_positives es el número de personas del grupo (privileged=False, es decir, sin privilegios, o privileged=True, es decir, con privilegios) que han recibido un resultado positivo, y num_instances es el número total de personas del grupo.

El número resultante será un porcentaje, que es el porcentaje del índice con el que el grupo sin privilegios recibe el resultado positivo respecto al índice con el que lo recibe el grupo con privilegios. Por ejemplo, si un modelo de riesgo crediticio asigna la predicción “sin riesgo” al 80% de los solicitantes sin privilegios y al 100% de los solicitantes con privilegios, este modelo tendría un impacto desigual (que se presenta como la puntuación de equidad del 80% en Watson OpenScale).

En Watson OpenScale, los resultados positivos se indican como los resultados favorables, y los resultados negativos se indican como los resultados desfavorables. El grupo con privilegios se designa como el grupo de referencia, y el grupo sin privilegios se designa como el grupo supervisado.

Se utiliza la fórmula matemática siguiente para calcular la equidad perfecta:

Igualdad perfecta =   Porcentaje de resultados favorables para todas las transacciones de referencia, 
                     incluidas las transacciones sintetizadas del grupo supervisado

Por ejemplo, si la característica supervisada es SEX y el grupo supervisado es FEMALE, la fórmula siguiente muestra la ecuación para la equidad perfecta:

Igualdad perfecta para `SEX` =  Porcentaje de resultados favorables para transacciones `HOMBRE`, 
                                 incluidas las transacciones sintetizadas, inicialmente `FEMALE`, pero cambiadas a `MALE`

Visualización del sesgo

Cuando se detecta un sesgo potencial, Watson OpenScale realiza varias funciones para confirmar si el sesgo es real. Watson OpenScale altera los datos invirtiendo el valor supervisado y el valor de referencia y luego ejecutando este nuevo registro con el modelo. A continuación, muestra la salida resultante como salida sin sesgo. Watson OpenScale también entrena un modelo sin sesgo duplicado que a continuación utiliza para detectar cuándo un modelo realizará una predicción sesgada.

Se utilizan dos conjuntos de datos distintos para calcular la equidad y la exactitud. La equidad se calcula utilizando los datos de carga útil + alterados. La exactitud se calcula utilizando los datos de opinión. Para calcular la exactitud, Watson OpenScale necesita datos etiquetados manualmente, que sólo están presentes en la tabla de opinión.

Los resultados de estas determinaciones están disponibles en la visualización de sesgos, que incluye las vistas siguientes. Sólo puede ver las vistas si hay datos a los que dar soporte.

  • Equilibrado: Este cálculo equilibrado incluye la solicitud de puntuación recibida para la hora seleccionada, más registros adicionales de horas anteriores, si no se ha alcanzado el número mínimo de registros necesarios para la evaluación. Incluye registros alterados/sintetizados adicionales utilizados para probar la respuesta del modelo cuando el valor de la característica supervisada cambia.

    Tome nota de los siguientes detalles de carga útil y alterados:

    • Grupos supervisados con puntuación de equidad
    • Grupos de referencia con puntuación de equidad
    • Origen del sesgo
  • Carga útil: Las solicitudes de puntuación reales recibidas por el modelo durante la hora seleccionada.

    Tome nota de los siguientes detalles de carga útil:

    • Datos de carga útil con diagrama de barras apiladas
    • Resultados favorables y desfavorables que corresponden a las etiquetas de modelo
    • Fecha y hora en que se cargaron las transacciones
  • Entrenamiento: Los registros de datos de entrenamiento utilizados para entrenar el modelo.

    Tome nota de los siguientes detalles de entrenamiento:

    • Número de registros de datos de entrenamiento. Los datos de entrenamiento se leen una vez, y la distribución se almacena en la variable subscription/fairness_configuration. Al calcular la distribución, el número de registros de datos de entrenamiento también se recupera y almacena en la misma distribución.
    • Cuando los datos de entrenamiento cambian, lo que indica que se ejecuta de nuevo el mandato POST /data_distribution, este valor se actualiza en la variable fairness_configuration/training_data_distribution. Al enviar la métrica, este valor se envía también.
  • Sin sesgo: La salida del algoritmo sin sesgo tras procesar el tiempo de ejecución y los datos alterados. Al seleccionar el botón de selección Sin sesgo se muestran los cambios en el modelo sin sesgo, en comparación con el modelo de producción. El gráfico refleja el estado de resultados mejorados para los grupos.

    Tome nota de los siguientes detalles sin sesgo:

    • El resultado de la eliminación del sesgo del modelo
    • Para grupos supervisados, tales como edad y sexo las puntuaciones anterior y posterior

Ejemplo

Considere un punto de datos donde, para Sexo=Hombre (Valor de referencia), el modelo predice un resultado favorable, pero cuando se perturba el registro cambiando Sexo a Mujer (valor supervisado), mientras se mantienen sin cambios todos los demás valores de características, el modelo predice un resultado desfavorable. En general se dice que un modelo muestra sesgo si hay puntos de datos suficientes (en los últimos N registros de la tabla de carga útil, más los datos perturbados) donde el modelo actúa de manera sesgada.

Modelos soportados

Watson OpenScale da soporte a la detección de sesgo sólo para aquellos modelos y funciones Python que esperan alguna clase de datos estructurados en su vector de característica.

Las métricas de equidad se calculan en función de los datos de carga útil de puntuación.

Para una supervisión adecuada, cada solicitud de puntuación se debe registrar también en Watson OpenScale. El registro de datos de carga útil está automatizado para los motores de IBM Watson Machine Learning.

Para otros motores de aprendizaje automático, los datos de carga útil se pueden proporcionar mediante el cliente Python o la API REST.

Para motores de aprendizaje automático que no sean IBM Watson Machine Learning, la supervisión de equidad crea solicitudes de puntuación adicionales en el despliegue supervisado.

Puede revisar la información siguiente:

  • Valores de métricas a lo largo del tiempo
  • Detalles relacionados, como resultados favorables y desfavorables
  • Transacciones detalladas
  • Punto final de puntuación sin sesgo recomendado

Métricas de equidad recomendadas

Watson OpenScale da soporte a las métricas de equidad siguientes:

Watson OpenScale da soporte a los siguientes atributos protegidos:

Detalles de equidad soportados

Watson OpenScale da soporte a los siguientes detalles de métricas de equidad:

  • Los porcentajes favorables para cada uno de los grupos
  • Los promedios de equidad para todos los grupos de equidad
  • Distribución de los datos para cada uno de los grupos supervisados
  • Distribución de los datos de carga útil