0 / 0
Volver a la versión inglesa de la documentación
Evaluaciones de equidad
Última actualización: 25 oct 2024
Evaluaciones de equidad

Puede configurar evaluaciones de imparcialidad para determinar si su modelo produce resultados sesgados. Utilice las evaluaciones de equidad para identificar cuándo su modelo muestra una tendencia a proporcionar resultados favorables más a menudo para un grupo que para otro.

Configuración de evaluaciones de equidad para modelos de aprendizaje automático

Si registra datos de carga útil al preparar las evaluaciones de modelos, puede configurar evaluaciones de equidad.

Puede configurar evaluaciones de equidad manualmente o puede ejecutar un cuaderno personalizado para generar un archivo de configuración. Puede cargar el archivo de configuración para especificar los valores para la evaluación.

Cuando configura las evaluaciones de equidad manualmente, puede especificar el grupo de referencia (valor) que espera que represente los resultados favorables. También puede seleccionar los atributos de modelo correspondientes (características) para supervisar el sesgo (por ejemplo, Edad o Sexo), que se comparará con el grupo de referencia. En función de sus datos de entrenamiento, también puede especificar el tamaño mínimo y máximo de la muestra para las evaluaciones.

Seleccionar resultados favorables y desfavorables

Debe especificar los resultados favorables y desfavorables al configurar las evaluaciones de equidad. Los valores que representan un resultado favorable se derivan de la columna label de los datos de entrenamiento. De forma predeterminada, la columna predictedLabel se establece como la columna prediction. Los valores favorables y desfavorables deben especificarse utilizando el valor de la columna prediction como un tipo de datos de serie, como por ejemplo 0 o 1, cuando se cargan datos de entrenamiento.

Seleccionar las características

Debe seleccionar las características que son los atributos del modelo que desea evaluar para detectar sesgos. Por ejemplo, puede evaluar rasgos como Sex o Age en busca de sesgos. Solo se da soporte a las características de un tipo de datos de equidad categórico, numérico (entero), flotante o doble.

Los valores de las características se especifican como un grupo de referencia o supervisado. El grupo supervisado representa los valores que están más expuestos a tener resultados sesgados. Por ejemplo, para la característica Sex, puede establecer Female y Non-binary como los grupos supervisados. Para una característica numérica, como por ejemplo Age, puede establecer [18-25] como el grupo supervisado. Todos los demás valores de la característica se consideran como el grupo de referencia, por ejemplo, Sex=Male o Age=[26,100].

Fijar umbral de equidad

Puede establecer el umbral de equidad para especificar una diferencia aceptable entre el porcentaje de resultados favorables del grupo supervisado y el porcentaje de resultados favorables del grupo de referencia. Por ejemplo, si el porcentaje de resultados favorables para un grupo en el modelo es del 70% y el umbral de equidad se establece en el 80%, el supervisor de equidad detecta el sesgo en el modelo.

Establecer tamaño de muestra

El tamaño de las muestras se utiliza para acelerar el procesamiento del número de transacciones que se evalúan. Debe establecer un tamaño mínimo de muestra para indicar el menor número de transacciones que desea evaluar. También puede establecer un tamaño máximo de muestra para indicar el número máximo de transacciones que desea evaluar.

Prueba de sesgo indirecto

Si selecciona un campo que no es una característica de entrenamiento, llamado campo añadido, el sesgo indirecto se identifica encontrando valores asociados en las características de entrenamiento. Por ejemplo, la profesión "estudiante" puede implicar a un individuo más joven aunque el campo Edad se haya excluido del entrenamiento del modelo. Para obtener más información sobre la configuración de las evaluaciones de imparcialidad para tener en cuenta la parcialidad indirecta, consulte Configuración del monitor de imparcialidad para la parcialidad indirecta.

Sesgo atenuante

Para la evaluación de los modelos de aprendizaje automático, se utiliza el desbarbado pasivo y activo. La eliminación del sesgo pasiva revela el sesgo, mientras que la eliminación de la eliminación del sesgo activa evita que se lleve a cabo ese sesgo cambiando el modelo en tiempo real para la aplicación actual. Para obtener detalles sobre cómo interpretar los resultados y mitigar el sesgo en un modelo, consulte Revisión de los resultados de una evaluación de equidad.

Medir el rendimiento con la matriz de confusión

La matriz de confusión mide el rendimiento clasifica las predicciones positivas y negativas en cuatro cuadrantes que representan la medida de los valores reales y predichos, como se muestra en el siguiente ejemplo:

Real/Previsto Negativos Positivos
Negativos TN FP
Positivos FN TPORC

El cuadrante negativo verdadero (NT) representa los valores que son realmente negativos y se predicen como negativos y el cuadrante positivo verdadero (PT) representa los valores que son realmente positivos y se predicen como positivos. El cuadrante de falsos positivos (FP) representa valores que en realidad son negativos pero que se predicen como positivos y el cuadrante de falsos negativos (FN) representa valores que en realidad son positivos pero que se predicen como negativos.

Nota: Las medidas de rendimiento no son compatibles con los modelos de regresión.

Tema principal: Configuración de las evaluaciones de equidad

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información