Realice esta guía de aprendizaje para crear una interconexión de extremo a extremo para entregar datos concisos, preprocesados y actualizados almacenados en un origen de datos externo para el caso de uso de Ciencia de datos y MLOps. Su objetivo es utilizar los conductos de orquestación para orquestar ese flujo de trabajo global para generar resultados automatizados, coherentes y repetibles. El oleoducto utilizaData Refinery yAutoAI, que automatiza varios aspectos del proceso de construcción de un modelo, como la ingeniería de características y la optimización de hiperparámetros. AutoAI clasifica los algoritmos candidatos y, a continuación, selecciona el mejor modelo.
La historia del tutorial es que Golden Bank quiere expandir su negocio ofreciendo renovaciones hipotecarias especiales de baja tasa para aplicaciones en línea. Las aplicaciones en línea amplían el acceso a clientes para el banco y reducen los costes de proceso de las solicitudes del banco. Para ayudar a los prestamistas con la toma de decisiones, el equipo utilizará Orchestration Pipelines para crear un conducto de datos que ofrezca datos actualizados sobre todos los solicitantes de hipotecas. Los datos se almacenan en Db2 Warehouse. Debe preparar los datos porque son potencialmente incompletos, obsoletos y pueden estar ofuscados o totalmente inaccesibles debido a las políticas de privacidad y soberanía de los datos. A continuación, el equipo crea un modelo de aprobación de hipotecas a partir de datos de confianza y despliega y prueba el modelo en un entorno de preproducción. Finalmente, el equipo utiliza un cuaderno para configurar supervisores de Watson OpenScale y, a continuación, evalúa y observa los supervisores en Watson OpenScale para asegurarse de que el modelo estaba tratando a todos los solicitantes de forma justa.
La siguiente imagen animada proporciona una vista previa rápida de lo que logrará al final de este tutorial. Editará y ejecutará una interconexión para crear y desplegar un modelo de aprendizaje automático, ejecutar un cuaderno para configurar supervisores y validar el modelo. Pulse la imagen para ver una imagen más grande.
Vista previa de la guía de aprendizaje
En esta guía de aprendizaje, realizará estas tareas:
- Configure los requisitos previos.
- Tarea 1: Ver los activos en el proyecto de ejemplo.
- Tarea 2: Explorar un conducto existente.
- Tarea 3: Añadir un nodo a la interconexión.
- Tarea 4: Ejecutar el conducto.
- Tarea 5: Ver los activos, el modelo desplegado y el despliegue en línea.
Si desea continuar para ver cómo supervisar el modelo utilizando Watson OpenScale, complete las tareas 6-10:
- Tarea 6: Ejecutar el cuaderno para configurar los supervisores de Watson OpenScale .
- Tarea 7: Evaluar el modelo.
- Tarea 8: Observar la calidad de los supervisores de modelo.
- Tarea 9: Observar la equidad de los supervisores de modelo.
- Tarea 10: Observar la explicabilidad de los supervisores de modelo.
- Limpieza (opcional)
Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Sugerencias para completar esta guía de aprendizaje
Estas son algunas sugerencias para completar correctamente esta guía de aprendizaje.
Utilizar la imagen en imagen de vídeo
La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:
Obtener ayuda en la comunidad
Si necesita ayuda con este tutorial, puede hacer una pregunta o encontrar una respuesta en el foro de debate de la Comunidad deCloud Pak for Data.
Configurar las ventanas del navegador
Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.
Configurar los requisitos previos
Registro en Cloud Pak for Data as a Service
Debe registrarse en Cloud Pak for Data as a Service y suministrar los servicios necesarios para el caso de uso de integración de datos.
- Si tiene una cuenta de Cloud Pak for Data as a Service existente, puede empezar con esta guía de aprendizaje. Si tiene una cuenta de plan Lite, sólo un usuario por cuenta puede ejecutar esta guía de aprendizaje.
- Si todavía no tiene una cuenta de Cloud Pak for Data as a Service , regístrese.
Verificar los servicios suministrados necesarios
Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 00:50.
Siga estos pasos para verificar o suministrar los servicios necesarios:
En el menú de navegación ' , seleccione Servicios > Instancias de servicio.
Utilice la lista desplegable Producto para determinar si existe una instancia del servicio watsonx.ai Studio.
Si necesitas crear una instancia de servicio de watsonx.ai Studio, haz clic en Añadir servicio.
Selecciona watsonx.ai Studio.
Seleccione el plan Lite.
Pulse Crear.
Espera mientras se aprovisiona el servicio watsonx.ai Studio, lo que puede tardar unos minutos en completarse.
Repita estos pasos para verificar o suministrar los siguientes servicios adicionales:
- tiempo de ejecución de watsonx.ai
- Cloud Object Storage
- watsonx.governance : si desea supervisar el modelo desplegado
' Comprueba tu progreso
La imagen siguiente muestra las instancias de servicio suministradas:
Crear el proyecto de ejemplo
' Para previsualizar esta tarea, vea el vídeo que comienza en 01:27.
Si ya tiene el proyecto de ejemplo para esta guía de aprendizaje, omita esta tarea. De lo contrario, siga estos pasos:
Accede al proyecto de ejemplo de Ciencia de datos y MLOps en el hub de recursos.
Pulse Crear proyecto.
Si se le solicita que asocie el proyecto a una instancia de Cloud Object Storage, seleccione una instancia de Cloud Object Storage de la lista.
Pulse Crear.
Espere a que finalice la importación del proyecto y, a continuación, pulse Ver proyecto nuevo para verificar que el proyecto y los activos se han creado correctamente.
Pulse la pestaña Activos para ver los activos de esta guía de aprendizaje.
' Comprueba tu progreso
La imagen siguiente muestra el separador Activos en el proyecto de ejemplo. Ahora está preparado para iniciar la guía de aprendizaje.
Asociar el servicio watsonx.ai Runtime con el proyecto de ejemplo
' Para previsualizar esta tarea, vea el vídeo que comienza en 02:17.
Utilizará ' watsonx.ai Runtime para crear y desplegar el modelo, así que siga estos pasos para asociar su instancia de servicio ' watsonx.ai Runtime con el proyecto de ejemplo.
En el proyecto Ciencia de datos y MLOps , pulse el separador Gestionar .
Pulse la página Servicios e integraciones .
Pulse Asociar servicio.
Marque la casilla junto a su instancia de servicio watsonx.ai Runtime.
Pulse Asociar.
Pulse Cancelar para volver a la página Servicios e integraciones .
' Comprueba tu progreso
La siguiente imagen muestra la página Servicios e integraciones con el servicio watsonx.ai Runtime en la lista. Ahora está preparado para crear el proyecto de ejemplo.
Tarea 1: Ver los activos en el proyecto de ejemplo
' Para previsualizar esta tarea, vea el vídeo que comienza en 02:37.
El proyecto de ejemplo incluye varios activos que incluyen una conexión, una definición de datos, un flujo de Data Refinery y un conducto. Siga estos pasos para ver estos activos:
Pulse la pestaña Activos en el proyecto Ciencia de datos y MLOps y, a continuación, visualice Todos los activos.
Ver la lista de activos de datos que se utilizan en el flujo de Data Refinery y el conducto. Estos activos se almacenan en una conexión de Data Fabric Trial- Db2 Warehouse en el esquema AI_MORTGAGE . Pulse Importar activosy, a continuación, vaya a Data Fabric Trial- Db2 Warehouse > AI_MORTGAGE. La imagen siguiente muestra los activos de dicha conexión:
El flujo Hipotecage_Data_Approvals_flow Data Refinery integra datos sobre cada solicitante de hipoteca. Los datos integrados incluyen información de identificación personal, con sus detalles de solicitud, puntajes de crédito, estatus como comprador comercial, y finalmente los precios de la casa elegida de cada solicitante. A continuación, el flujo crea un archivo secuencial con el nombre
Mortgage_Data_with_Approvals_DS.csv
en el proyecto que contiene los datos unidos. La imagen siguiente muestra el flujo Hipotecage_Data_Approvals_flow Data Refinery :
' Comprueba tu progreso
La imagen siguiente muestra todos los activos del proyecto de ejemplo. Ahora está preparado para explorar el conducto en el proyecto de ejemplo.
Tarea 2: Explorar un conducto existente
' Para previsualizar esta tarea, vea el vídeo que comienza en 03:25.
El proyecto de ejemplo incluye un conducto de orquestación, que automatiza las tareas siguientes:
Ejecute un trabajo Data Refinery existente.
Cree un experimento de AutoAI .
Ejecute el experimento AutoAI y guarde el modelo de mejor rendimiento que utiliza el archivo de salida resultante del trabajo Data Refinery como datos de entrenamiento.
Cree un espacio de despliegue.
Promocione el modelo guardado al espacio de despliegue.
Siga estos pasos para explorar el conducto:
En la pestaña Activos del proyecto Ciencia de datos y MLOps , visualice Todos los activos.
Pulse Conducto de aprobación de hipoteca-Ciencia de datos para abrir el conducto.
Efectúe una doble pulsación en el trabajo Integrar datos de aprobación hipotecaria Data Refinery , que combina varias tablas de la conexión de Db2 Warehouse on Cloud en un conjunto de datos etiquetado cohesivo que se utiliza como datos de entrenamiento para el experimento AutoAI . Pulse Cancelar para volver a la interconexión.
Pulse la condición Comprobar estado y elija Editar. Esta condición es un punto de decisión en el conducto para confirmar la finalización del trabajo de Data Refinery con un valor de Completado o Completado con avisos. Pulse Cancelar para volver a la interconexión.
Efectúe una doble pulsación en el nodo Crear experimento de AutoAI para ver los valores. Este nodo crea un experimento de AutoAI con los valores.
Revise los valores para los valores siguientes:
Nombre del experimento de AutoAI
Ámbito
Tipo de predicción
Columna de predicción
Clase positiva
Índice de división de datos de entrenamiento
Algoritmos a incluir
Algoritmos a utilizar
Métrica de optimización
Pulse Cancelar para cerrar los valores.
Efectúe una doble pulsación en el nodo Ejecutar experimento de AutoAI para ver los valores. Este nodo ejecuta el experimento AutoAI creado por el nodo Crear experimento AutoAI que utiliza la salida del trabajo Integrar aprobación de hipoteca Data Refinery como datos de entrenamiento.
Revise los valores para los valores siguientes:
Experimento AutoAI
Activos de datos de entrenamiento
Prefijo del nombre de modelo
Pulse Cancelar para cerrar los valores.
Entre los nodos Ejecutar experimento de AutoAI y Crear espacio de despliegue , pulse ¿Desea desplegar el modelo? y elija Editar. El valor de True para esta condición es un punto de decisión en la interconexión para continuar creando el espacio de despliegue. Pulse Cancelar para volver a la interconexión.
Efectúe una doble pulsación en el nodo Crear espacio de despliegue para actualizar los valores. Este nodo crea un nuevo espacio de despliegue con el nombre especificado, y requiere la entrada de sus servicios Cloud Object Storage y watsonx.ai Runtime.
Revise el valor de Nombre de espacio nuevo .
Para el campo Nuevo CRN de instancia de COS , seleccione la instancia de Cloud Object Storage en la lista.
En el campo New space WML Instance CRN, seleccione su instancia watsonx.ai Runtime de la lista.
Pulse Guardar.
Efectúe una doble pulsación en el nodo Promocionar modelo a espacio de despliegue para ver los valores. Este nodo promociona el mejor modelo del nodo Ejecutar experimento de AutoAI al espacio de despliegue creado desde el nodo Crear espacio de despliegue .
Revise los valores para los valores siguientes:
Activos de origen
Destino
Pulse Cancelar para cerrar los valores.
' Comprueba tu progreso
La imagen siguiente muestra el conducto inicial. Ahora está preparado para editar la interconexión para añadir un nodo.
Tarea 3: Añadir un nodo a la interconexión
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 05:41.
La interconexión crea el modelo, crea un espacio de despliegue y, a continuación, lo promociona a un espacio de despliegue. Debe añadir un nodo para crear un despliegue en línea. Siga estos pasos para editar el conducto para automatizar la creación de un despliegue en línea:
Añada el nodo Crear despliegue en línea al lienzo:
Expanda la sección Crear en la paleta de nodos.
Arrastre el nodo Crear despliegue en línea al lienzo y suelte el nodo después del nodo Promocionar modelo a espacio de despliegue .
Pase el cursor por encima del nodo Promocionar modelo a espacio de despliegue para ver la flecha. Conecte la flecha al nodo Crear despliegue en línea .
Nota: Los nombres de nodo en la interconexión pueden diferir de la siguiente imagen animada.Conecte el comentario Crear despliegue en línea para modelo promocionado al nodo Crear despliegue en línea conectando el círculo del recuadro de comentario al nodo.
Nota: Los nombres de nodo en la interconexión pueden diferir de la siguiente imagen animada.Efectúe una doble pulsación en el nodo Crear despliegue en línea para ver los valores.
Cambie el nombre de nodo a
Create Online Deployment
.Junto a Activo ML, pulse Seleccionar de otro nodo en el menú.
Seleccione el nodo Promocionar modelo a espacio de despliegue en la lista. El ID de nodo winning_model está seleccionado.
Para el Nuevo nombre de despliegue, escriba
Mortgage approval model deployment - Data Science
.En Modalidad de creación, seleccione Sobrescribir.
Pulse Guardar para guardar los valores del nodo Crear despliegue en línea .
' Comprueba tu progreso
La imagen siguiente muestra la interconexión completada. Ahora está preparado para ejecutar el conducto.
Tarea 4: Ejecutar el conducto
' Para previsualizar esta tarea, vea el vídeo que comienza en 06:57.
Ahora que la interconexión se ha completado, siga estos pasos para ejecutar la interconexión:
En la barra de herramientas, pulse Ejecutar conducto > Ejecutar prueba.
En la página Definir parámetros de interconexión , seleccione True para el despliegue.
Si se establece en True, la interconexión verifica el modelo desplegado y puntúa el modelo.
Si se establece en False, la interconexión verifica que el modelo se ha creado en el proyecto mediante el experimento AutoAI y revisa la información del modelo y las métricas de entrenamiento.
Proporcione una clave de API si esta es la primera vez que ejecuta un conducto. Los activos de conducto utilizan su clave de API personal de IBM Cloud para ejecutar operaciones de forma segura sin interrupciones.
Si tiene una clave de API existente, pulse Utilizar clave de API existente, pegue la clave de API y pulse Guardar.
Si no tiene una clave de API existente, pulse Generar nueva clave de API, proporcione un nombre y pulse Guardar. Copie la clave de API y, a continuación, guarde la clave de API para utilizarla en el futuro. Cuando haya terminado, pulse Cerrar.
Pulse Ejecutar para iniciar la ejecución del conducto.
Supervise el progreso de la interconexión.
Desplácese por los registros consolidados mientras se ejecuta el conducto. La ejecución de prueba puede tardar hasta 10 minutos en completarse.
A medida que se completa cada operación, seleccione el nodo para dicha operación en el lienzo.
En la pestaña Inspector de nodo , vea los detalles de la operación.
Pulse la pestaña Salida de nodo para ver un resumen de la salida para cada operación de nodo.
' Comprueba tu progreso
La imagen siguiente muestra el conducto después de completar la ejecución de prueba. Ahora está preparado para revisar los activos que ha creado el conducto.
Tarea 5: Ver los activos, el modelo desplegado y el despliegue en línea
' Para previsualizar esta tarea, vea el vídeo que comienza en 08:58.
El conducto ha creado varios activos. Siga estos pasos para ver los activos:
Pulse el nombre del proyecto Ciencia de datos y MLOps en la ruta de navegación para volver al proyecto.
En la ficha Activos , vea Todos los activos.
Ver los activos de datos.
Pulse el activo de datos Mortgage_Data_with_Approvals_DS.csv . El trabajo de Data Refinery ha creado este activo.
Pulse el nombre del proyecto Ciencia de datos y MLOps en la ruta de navegación para volver a la pestaña Activos .
Ver el modelo.
Pulse el activo de modelo de aprendizaje automático que empieza por ds_hipotecage_approval_best_model. El experimento AutoAI ha generado varios candidatos de modelo y lo ha elegido como el mejor modelo. Guarde este nombre de modelo en un archivo de texto. El nombre de modelo es necesario para configurar los supervisores de Watson OpenScale en la siguiente tarea.
Desplácese por la información del modelo.
Pulse el nombre del proyecto Ciencia de datos y MLOps en la ruta de navegación para volver a la pestaña Activos .
Pulse el separador Trabajos en el proyecto para ver información sobre los trabajos de Data Refinery y Pipeline.
Abra el espacio de despliegue que ha creado con el conducto.
En el menú de navegación ' , seleccione Despliegues.
Pulse la pestaña Espacios .
Pulse el espacio de despliegue Aprobación de hipoteca-Ciencia de datos y MLOps .
Pulse la pestaña Activos y consulte el modelo desplegado que empieza por ds_hipotecage_approval_best_model.
Pulse la pestaña Despliegues.
Pulse Despliegue del modelo de aprobación de hipotecas-Ciencia de datos para ver el despliegue.
En el separador Referencia de API , visualice el punto final de API y los fragmentos de código.
Pulse el separador Probar.
Pulse la pestaña Entrada JSON y sustituya el texto de ejemplo por el siguiente texto JSON.
{ "input_data": [ { "fields": [ "ID", "NAME", "STREET_ADDRESS", "CITY", "STATE", "STATE_CODE", "ZIP_CODE", "EMAIL_ADDRESS", "PHONE_NUMBER", "GENDER", "SOCIAL_SECURITY_NUMBER", "EDUCATION", "EMPLOYMENT_STATUS", "MARITAL_STATUS", "INCOME", "APPLIEDONLINE", "RESIDENCE", "YRS_AT_CURRENT_ADDRESS", "YRS_WITH_CURRENT_EMPLOYER", "NUMBER_OF_CARDS", "CREDITCARD_DEBT", "LOANS", "LOAN_AMOUNT", "CREDIT_SCORE", "CRM_ID", "COMMERCIAL_CLIENT", "COMM_FRAUD_INV", "FORM_ID", "PROPERTY_CITY", "PROPERTY_STATE", "PROPERTY_VALUE", "AVG_PRICE" ], "values": [ [ null, null, null, null, null, null, null, null, null, null, null, "Bachelor", "Employed", null, 144306, null, "Owner Occupier", 15, 19, 2, 7995, 1, 1483220, 437, null, false, false, null, null, null, 111563, null ], [ null, null, null, null, null, null, null, null, null, null, null, "High School", "Employed", null, 45283, null, "Private Renting", 11, 13, 1, 1232, 1, 7638, 706, null, false, false, null, null, null, 54262, null ] ] } ] }
Pulse Pronosticar. Los resultados muestran que el primer solicitante no será aprobado y el segundo solicitante será aprobado.
' Comprueba tu progreso
La imagen siguiente muestra los resultados de la prueba. Las puntuaciones de confianza para la prueba pueden ser diferentes de las que se muestran en la imagen.
Tarea 6: Ejecutar el cuaderno para configurar los supervisores de Watson OpenScale
Para obtener una vista preliminar de esta tarea, vea el vídeo que empieza en 10:40.
Ahora está preparado para ejecutar el cuaderno incluido en el proyecto de ejemplo. El cuaderno incluye el código para:
- Capte el modelo y los despliegues.
- Configure Watson OpenScale.
- Cree el proveedor de servicios y la suscripción para el servicio de aprendizaje automático.
- Configure el supervisor de calidad.
- Configure el supervisor de equidad.
- Configure la explicabilidad.
Siga estos pasos para ejecutar el cuaderno incluido en el proyecto de ejemplo. Tómese un tiempo para leer los comentarios en el cuaderno, que explican el código en cada celda.
En el menú de navegación ' , seleccione Proyectos > Ver todos los proyectos.
Pulse el nombre del proyecto Ciencia de datos y MLOps .
Haga clic en la pestaña Activos y, a continuación, vaya a Cuadernos.
Abra el cuaderno monitor-wml-model-with-watson-openscale-pipeline .
Haga clic en el icono Editar ' para poner el cuaderno en modo edición.
Cuando importa un proyecto desde el concentrador de recursos, la primera celda del cuaderno contiene la señal de acceso del proyecto. Si este cuaderno no contiene una primera celda con una señal de acceso de proyecto, debe generar la señal. En el menú Más, seleccione Insertar señal de proyecto. Esta acción inserta una celda nueva como la primera celda del cuaderno que contiene la señal de proyecto.
Proporcione la clave de API en la sección Proporcionar la clave de API de IBM Cloud . Debe pasar sus credenciales a la API de tiempo de ejecución de watsonx.ai mediante una clave de API. Si todavía no tiene una clave de API guardada, siga estos pasos para crear una clave de API.
' Para previsualizar esta tarea, vea el vídeo que comienza en 04:55.Pulse Crear una clave de API de IBM Cloud. Si tiene alguna clave de API existente, el botón se puede etiquetar como Crear.
Escriba un nombre y una descripción.
Pulse Crear.
Copie la clave de API.
Descargue la clave de API para su uso futuro.
Vuelva al cuaderno y pegue la clave de API en el campo ibmcloud_api_key .
En la sección 3. Modelo y despliegue, para la variable model_name , pegue el nombre de modelo que ha guardado en un archivo de texto en la tarea anterior. space_name y deployment_name se rellenan automáticamente utilizando los nombres especificados en la interconexión.
Pulse Celda > Ejecutar todo para ejecutar todas las celdas del cuaderno. Alternativamente, haga clic en el icono Ejecutar ' para ejecutar el cuaderno celda por celda y explorar cada celda y su resultado.
Supervise el progreso celda por celda, observando el asterisco "En [
*
]" cambiando a un número, por ejemplo, "En [1
]". El cuaderno tarda de 1 a 3 minutos en completarse.Pruebe estas sugerencias si encuentra algún error al ejecutar el cuaderno:
- Pulse Kernel > Reiniciar y borrar salida para reiniciar el kernel y, a continuación, vuelva a ejecutar el cuaderno.
- Verifique que ha copiado y pegado el nombre de despliegue exactamente sin espacios iniciales o finales.
' Comprueba tu progreso
La imagen siguiente muestra el cuaderno cuando la ejecución se ha completado. El cuaderno ha guardado el modelo en el proyecto, por lo que ahora está preparado para evaluar el modelo.
Tarea 7: Evaluar el modelo
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 13:35.
Siga estos pasos para evaluar el modelo en Watson OpenScale:
Haz clic en el proyecto Data Science and MLOps en la ruta de navegación.
En la pestaña Activos , expanda el tipo de activo Datos y, a continuación, pulse Activos de datos.
Haga clic en el menú de desbordamiento ' para el activo de datos mortgage_sample_test_data.csv y seleccione Descargar. Para validar que el modelo funciona según sea necesario, necesita un conjunto de datos etiquetados, que se han mantenido fuera del entrenamiento del modelo. Este archivo CSV contiene los datos de reserva.
Inicie Watson OpenScale.
En el menú de navegación ' , seleccione Servicios > Instancias de servicio.
Pulse el nombre de instancia de Watson OpenScale . Si se le solicita, inicie sesión utilizando las mismas credenciales que ha utilizado para registrarse en Cloud Pak for Data.
En la página de instancia de servicio de Watson OpenScale, pulse Iniciar aplicación.
En el panel de control de Insights, pulse el mosaico Despliegue del modelo de aprobación de hipoteca-Ciencia de datos .
En el menú Acciones, seleccione Evaluar ahora.
En la lista de opciones de importación, seleccione desde archivo CSV.
Arrastre el archivo de datos mortgage_sample_test_data.csv que ha descargado del proyecto al panel lateral.
Pulse Cargar y evaluar. La evaluación puede tardar varios minutos en completarse.
' Comprueba tu progreso
La imagen siguiente muestra el resultado de la evaluación para el modelo desplegado en Watson OpenScale. Ahora que ha evaluado el modelo, está preparado para observar la calidad del modelo.
Tarea 8: Observar la calidad de los monitores de modelo
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 14:44.
El supervisor de calidad de Watson OpenScale genera un conjunto de métricas para evaluar la calidad del modelo. Puede utilizar estas métricas de calidad para determinar lo bien que predice el modelo los resultados. Cuando se complete la evaluación que utiliza los datos reservados, siga estos pasos para observar la calidad o precisión del modelo:
En el panel de navegación izquierdo, haga clic en el icono ' del panel Insights.
Localice el mosaico Despliegue del modelo de aprobación de hipotecas-Ciencia de datos . Tenga en cuenta que el despliegue tiene 0 problemas y que las pruebas de Calidad y Equidad no han generado ningún error, lo que significa que el modelo ha alcanzado los umbrales necesarios para ello.
Nota: Es posible que tenga que renovar el panel de control para ver las actualizaciones después de la evaluación.Pulse el mosaico Despliegue del modelo de aprobación de hipotecas-Ciencia de datos para ver más detalles.
En la sección Calidad, haga clic en el icono Configurar ' . Aquí puede ver que el umbral de calidad que está configurado para este monitor es del 70% y que la medición de calidad que se está utilizando es área bajo la curva ROC.
Pulse Ir a resumen de modelo para volver a la pantalla de detalles de modelo.
En la sección Calidad, haga clic en el icono Detalles ' ' para ver los resultados detallados de la calidad del modelo. Aquí puede ver una serie de cálculos de métricas de calidad y una matriz de confusión que muestra las decisiones correctas del modelo junto con falsos positivos y falsos negativos. El área calculada bajo la curva ROC es 0.9 o superior, lo que supera el umbral 0.7 , por lo que el modelo cumple sus requisitos de calidad.
Pulse Despliegue del modelo de aprobación de hipoteca-Ciencia de datos en la ruta de navegación para volver a la pantalla de detalles del modelo.
' Comprueba tu progreso
La imagen siguiente muestra los detalles de calidad en Watson OpenScale. Las puntuaciones de calidad pueden variar. Ahora que ha observado la calidad del modelo, puede observar la equidad del modelo.
Tarea 9: Observar la equidad en los supervisores del modelo
' Para previsualizar esta tarea, vea el vídeo que comienza en el minuto 15:59.
El supervisor de equidad de Watson OpenScale genera un conjunto de métricas para evaluar la equidad del modelo. Puede utilizar las métricas de equidad para determinar si el modelo produce resultados sesgados. Siga estos pasos para observar la equidad del modelo:
En la sección Equidad, haga clic en el icono Configurar ' . Aquí se ve que se está revisando el modelo para garantizar que los solicitantes estén siendo tratados de manera justa independientemente de su género. Las mujeres se identifican como el grupo supervisado para el que se está midiendo la equidad, y el umbral de equidad debe ser de al menos el 80%. El supervisor de equidad utiliza el método de impacto dispar para determinar la equidad. El impacto dispar compara el porcentaje de resultados favorables para un grupo supervisado con el porcentaje de resultados favorables para un grupo de referencia.
Pulse Ir a resumen del modelo Para volver a la pantalla de detalles del modelo,
En la sección Equidad, haga clic en el icono Detalles ' para ver los resultados detallados de la equidad del modelo. Aquí puede ver el porcentaje de solicitantes masculinos y femeninos que se están aprobando automáticamente, junto con una puntuación de equidad de aproximadamente el 100%, por lo que el rendimiento del modelo supera con creces el umbral de equidad del 80% requerido.
Observe los conjuntos de datos identificados en la lista Conjunto de datos . Para asegurarse de que las métricas de equidad son más precisas, Watson OpenScale utiliza la perturbación para determinar los resultados en los que sólo se cambian los atributos protegidos y las entradas de modelo relacionadas, mientras que otras características siguen siendo las mismas.La perturbación cambia los valores de la característica del grupo de referencia al grupo supervisado o viceversa. Estos guardaraíles adicionales se utilizan para calcular la equidad cuando se utiliza el conjunto de datos "equilibrado", pero también puede ver los resultados de equidad utilizando sólo datos de entrenamiento de carga útil o modelo. Dado que el modelo se comporta de manera justa, no es necesario entrar en detalles adicionales para esta métrica.
Pulse la ruta de navegación Despliegue del modelo de aprobación de hipoteca-Ciencia de datos para volver a la pantalla de detalles del modelo.
' Comprueba tu progreso
La imagen siguiente muestra los detalles de equidad en Watson OpenScale. Ahora que ha observado la equidad del modelo, puede observar la explicabilidad del modelo.
Tarea 10: Observar la explicabilidad de los supervisores de modelo
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 17:42.
Es necesario entender cómo el modelo llegó a su decisión. Esta comprensión es necesaria tanto para explicar las decisiones a las personas implicadas en la aprobación del préstamo como para asegurarse de que los propietarios del modelo sean válidos. Para comprender estas decisiones, siga estos pasos para observar la explicabilidad del modelo:
En el panel de navegación izquierdo, haga clic en el icono Explicar una transacción " .
Seleccione Despliegue del modelo de aprobación de hipotecas-Ciencia de datos para ver una lista de transacciones.
Para cualquier transacción, pulse Explicar en la columna Acciones. Aquí se ve la explicación detallada de esta decisión.Verá las entradas más importantes para el modelo junto con la importancia de cada una para el resultado final. Las barras azules representan entradas que tienden a dar soporte a la decisión del modelo, mientras que las barras rojas muestran entradas que podrían haber llevado a otra decisión. Por ejemplo, un solicitante podría tener ingresos suficientes para ser aprobado de otro modo, pero su pobre historial de crédito y su elevada deuda juntos llevan al modelo a rechazar la solicitud.Revise esta explicación para evaluar la base de la decisión del modelo.
Opcional: Si desea profundizar más en cómo el modelo ha tomado su decisión, pulse la pestaña Inspeccionar . Utilice la característica Inspeccionar para analizar la decisión de buscar áreas de sensibilidad en las que pequeños cambios en unas pocas entradas resultarían en una decisión diferente. Puede probar usted mismo la sensibilidad alterando temporalmente algunas de las entradas reales con alternativas para ver si estas afectarían al resultado.
' Comprueba tu progreso
La imagen siguiente muestra la explicabilidad de una transacción en Watson OpenScale. Ha determinado que el modelo es preciso y trata a todos los solicitantes de forma justa. Ahora, puede avanzar el modelo a la siguiente fase de su ciclo de vida.
El equipo de Golden Bank utilizó Orchestration Pipelines para crear un conducto de datos que entrega datos actualizados sobre todos los solicitantes de hipotecas y un modelo de aprendizaje automático que los prestamistas pueden utilizar para la toma de decisiones. A continuación, el equipo utilizó Watson OpenScale para asegurarse de que el modelo estaba tratando a todos los solicitantes de forma justa.
Limpieza (opcional)
Si desea retomar esta guía de aprendizaje, suprima los artefactos siguientes.
Artefacto | Cómo suprimir |
---|---|
Despliegue del modelo de aprobación de hipoteca-Ciencia de datos en el espacio de despliegue Aprobación de hipoteca-Ciencia de datos y MLOps | Suprima un despliegue |
Espacio de despliegue Aprobación de hipoteca-Ciencia de datos y MLOps | Suprimir un espacio de despliegue |
Proyecto de ejemplo Data Science y MLOps | Suprimir un proyecto |
Próximos pasos
Pruebe estas guías de aprendizaje:
Regístrese para otro caso de uso.
Más información
Tema padre: Guías de aprendizaje de casos de uso