0 / 0
Volver a la versión inglesa de la documentación
Caso de uso de MLOps y AI de confianza
Caso de uso de MLOps y AI de confianza

Caso de uso de MLOps y AI de confianza

Para gestionar datos y modelar activos en todo el ciclo de vida de IA, su empresa necesita sistemas y procesos integrados. Cloud Pak for Data as a Service proporciona los procesos y tecnologías para permitir a su empresa desarrollar, desplegar, mantener y gestionar modelos de aprendizaje automático (ML) e IA en producción.

Vea este vídeo para ver el caso de uso de entramado de datos para implementar una solución en Cloud Pak for Data.

Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.

Desafíos

El establecimiento de soluciones de MLOps and trustworthy AI para las empresas implica abordar estos retos:

Acceso a datos
Las organizaciones deben proporcionar un acceso fácil a los datos consolidados y controlados para los equipos de ciencia de datos que utilizan los datos para crear aplicaciones de IA y ML de confianza.

Operacionalización de modelos
Las organizaciones necesitan implementar procesos repetibles para crear y desplegar modelos y adoptar los modelos en entornos de producción.

Garantizar el gobierno y la conformidad de los modelos
Las organizaciones necesitan supervisar los modelos en producción para asegurarse de que los modelos son explicables, válidos y precisos, y que no introducen sesgos ni se alejan de los objetivos previstos.

Puede resolver estos retos implementando un ciclo de vida automatizado MLOps con entramado de datos en Cloud Pak for Data as a Service.


Ejemplo: Los retos de Golden Bank

Siga la historia de Golden Bank mientras implementa un proceso de MLOps and trustworthy AI para ampliar su negocio ofreciendo renovaciones de hipotecas de baja tasa para aplicaciones en línea. Los científicos de datos de Golden Bank necesitan crear un modelo de aprobación hipotecaria que evite riesgos imprevistos y trate a todos los solicitantes de forma justa.

Proceso

Para implementar MLOps and trustworthy AI para su empresa, su organización puede seguir este proceso:

  1. Compartir los datos
  2. Crear y entrenar modelos
  3. Desplegar modelos
  4. Modelos de supervisión
  5. Modelos de seguimiento
  6. Automatice el ciclo de vida de IA

Los servicios de Watson Studio, Watson Machine Learning, Watson OpenScaley Watson Knowledge Catalog en Cloud Pak for Data as a Service proporcionan las herramientas y procesos que su organización necesita para implementar un MLOps and trustworthy AI de confianza.

Imagen que muestra el flujo de los MLOps y el caso de uso de IA más interesante

1. Compartir los datos

El catálogo sirve como una tienda de características donde los equipos de expertos en datos pueden encontrar activos de datos de alta calidad con las características que necesitan. Pueden añadir activos de datos de un catálogo a un proyecto, donde colaboran para preparar, analizar y modelar los datos.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Catálogos Utilice catálogos en Watson Knowledge Catalog como tienda de características para organizar los activos para compartir entre los colaboradores de su organización.

Aproveche la búsqueda semántica basada en IA y las recomendaciones para ayudar a los usuarios a encontrar lo que necesitan.
Los usuarios necesitan comprender, colaborar, enriquecer y acceder fácilmente a los datos de alta calidad.

Desea aumentar la visibilidad de los datos y la colaboración entre usuarios empresariales.

Necesitará que los usuarios vean, accedan, manipulen y analicen los datos sin comprender su formato físico o ubicación, y sin tener que moverlos o copiarlos.

Desea que los usuarios mejoren los activos valorándolos y revisándolos.


Ejemplo: Catálogo de Golden Bank

El líder del equipo de gobierno crea un catálogo, "Catálogo de aprobación hipotecaria" y añade los encargados de datos y los científicos de datos como colaboradores del catálogo. Los encargados de datos publican los activos de datos que han creado en el catálogo. Los científicos de datos encuentran los activos de datos, organizados por los encargados de datos, en el catálogo y copian esos activos en un proyecto. En su proyecto, los científicos de datos pueden refinar los datos para prepararlos para entrenar un modelo.


2. Crear y entrenar modelos

Para obtener información predictiva basada en sus datos, los científicos de datos, los analistas de negocio y los ingenieros de machine learning pueden crear y entrenar modelos. Los científicos de datos utilizan los servicios de Cloud Pak for Data as a Service para crear los modelos de IA, asegurándose de que se utilicen los algoritmos y optimizaciones adecuados para realizar predicciones que ayuden a resolver problemas de negocio.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
AutoAI Utilice AutoAI en Watson Studio para seleccionar automáticamente algoritmos, diseñar características, generar candidatos de interconexión y entrenar candidatos de interconexión de modelo.

A continuación, evalúe las interconexiones clasificadas y guarde las mejores como modelos.

Desplegar los modelos entrenados a un espacio, o exportar el conducto de entrenamiento de modelos que desee de AutoAI a un cuaderno para refinarlo.
Desea una forma avanzada y automatizada de crear rápidamente un buen conjunto de conductos y modelos de entrenamiento.

Desea poder exportar los conductos generados para refinarlos.
Cuadernos y scripts Utilice cuadernos y scripts en Watson Studio para escribir su propio entrenamiento de modelos de ingeniería de características y código de evaluación en Python, o R basado en conjuntos de datos de entrenamiento que están disponibles en el proyecto, o conexiones con orígenes de datos como bases de datos, lagos de datos o almacenamiento de objetos.

Utilice sus algoritmos y bibliotecas favoritos.
Desea utilizar las habilidades de codificación Python o R para tener un control completo sobre el código que se utiliza para crear, entrenar y evaluar los modelos.
Flujos de SPSS Modeler Utilice los flujos de SPSS Modeler en Watson Studio para crear sus propios flujos de entrenamiento, evaluación y puntuación de modelos basados en conjuntos de datos de entrenamiento que están disponibles en el proyecto, o conexiones con orígenes de datos como bases de datos, lagos de datos o almacenamiento de objetos. Desea una forma sencilla de explorar datos y definir flujos de entrenamiento, evaluación y puntuación de modelos.
RStudio Analice datos y cree y pruebe modelos trabajando con R en un entorno de desarrollo de RStudio Server con R 3.6. Desea utilizar un entorno de desarrollo para trabajar en R.
Decision Optimization Prepare datos, importe modelos, resuelva problemas y compare escenarios, visualice datos, busque soluciones, genere informes y guarde modelos para desplegarlos con Watson Machine Learning. Necesita evaluar millones de posibilidades para encontrar la mejor solución a un problema de analítica prescriptiva.
Aprendizaje federado Entrene un modelo común utilizando datos distribuidos. Es necesario entrenar un modelo sin mover, combinar o compartir datos que se distribuyen entre varias ubicaciones.


Ejemplo: Formación y construcción de modelos de Golden Bank

Los científicos de datos de Golden Bank crean un modelo, "Modelo de aprobación hipotecaria", que evita riesgos imprevistos y trata a todos los solicitantes de forma justa. Desean realizar un seguimiento del historial y el rendimiento del modelo desde el principio, por lo que añaden una entrada de modelo al "Catálogo de aprobación de hipoteca". Ejecutan un cuaderno para crear el modelo y predecir qué solicitantes califican para las hipotecas. Los detalles del entrenamiento del modelo se capturan automáticamente como metadatos en la entrada del modelo.


3. Desplegar modelos

Cuando los miembros del equipo de operaciones despliegan sus modelos de IA, los modelos están disponibles para que las aplicaciones los utilicen para realizar puntuaciones y predicciones que ayuden a impulsar acciones.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Interfaz de usuario de espacios (IU) Utilice la interfaz de usuario de espacios en Watson Machine Learning para desplegar modelos y otros activos desde proyectos a espacios. Cuando prefiera utilizar una interfaz de usuario.
Herramienta de línea de mandatos (cpdctl) Utilice la herramienta de línea de mandatos cpdctl en Watson Machine Learning para gestionar el ciclo de vida de los modelos, incluidos los valores de configuración, y para automatizar un flujo de extremo a extremo que incluye entrenar el modelo, guardarlo, crear un espacio de despliegue y desplegar el modelo. Desea desplegar y gestionar modelos para probar o entornos de producción desde una línea de mandatos.


Ejemplo: Despliegue del modelo de Golden Bank

Los miembros del equipo de operaciones de Golden Bank promocionan el "Modelo de aprobación de hipoteca" del proyecto a un espacio de despliegue y, a continuación, crean un despliegue de modelo en línea.


4. Supervisar modelos desplegados

Después de desplegar modelos, es importante controlarlos y supervisarlos para asegurarse de que son explicables y transparentes. Los científicos de datos necesitan poder explicar cómo llegan los modelos a determinadas predicciones para que puedan determinar si las predicciones tienen algún sesgo implícito o explícito. Además, es una práctica recomendada para ver el rendimiento del modelo y los problemas de coherencia de datos durante el ciclo de vida del modelo.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Watson OpenScale Problemas de equidad del modelo de Monitor en varias características.

Supervisar el rendimiento del modelo y la coherencia de los datos a lo largo del tiempo.

Explicar cómo ha llegado el modelo a determinadas predicciones con factores de peso.

Mantener e informar sobre el gobierno del modelo y el ciclo de vida en toda la organización.
Cuando tiene características que están protegidas o que pueden contribuir a la equidad de predicción.

Es necesario rastrear el rendimiento del modelo y las coherencias de datos a lo largo del tiempo.

Es necesario saber por qué el modelo proporciona determinadas predicciones.


Ejemplo: supervisión del modelo de Golden Bank

Los científicos de datos de Golden Bank utilizan Watson OpenScale para supervisar el "Modelo de aprobación de hipotecas" desplegado para asegurarse de que es preciso y trata a todos los solicitantes de hipotecas de Golden Bank de forma justa. Ejecutan un cuaderno para configurar supervisores para el modelo y, a continuación, modificar la configuración utilizando la interfaz de usuario de Watson OpenScale . Utilizando las métricas del supervisor de calidad y del supervisor de equidad de Watson OpenScale , los científicos de datos determinan qué tan bien predice el modelo los resultados y si produce algún resultado sesgado. También obtienen una comprensión de cómo el modelo llega a las decisiones para que las decisiones se puedan explicar a los solicitantes de hipoteca.


5. Modelos de seguimiento

Además de supervisar la equidad y la explicabilidad de los modelos, el equipo necesita realizar un seguimiento de los modelos de producción para asegurarse de que funcionan bien.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Hojas de datos En el inventario de modelos de un catálogo en Watson Knowledge Catalog, visualice el estado del ciclo de vida de todos los activos registrados y descienda a mayor nivel de detalle hasta las hojas de datos detalladas para los modelos o despliegues registrados en la entrada del modelo.

Ver detalles generales del modelo, información y métricas de entrenamiento y esquema de entrada y salida.

Ver detalles generales del despliegue, detalles de evaluación, métricas de calidad, detalles de equidad y detalles de desviación.
Desea asegurarse de que el modelo funciona según lo esperado.

Desea determinar si es necesario realizar ajustes.


Ejemplo: Seguimiento del modelo de Golden Bank

Los analistas de negocios de Golden Bank solicitan un "Modelo de Aprobación de Hipoteca". A continuación, pueden realizar un seguimiento del modelo a través de todas las etapas del ciclo de vida de IA a medida que los científicos de datos crean y entrenan el modelo y los ingenieros de ModelOps lo despliegan y evalúan. Las hojas de datos documentan detalles sobre el historial del modelo y generan métricas que muestran su rendimiento.


6. Automatizar el ciclo de vida de ML

Su equipo puede automatizar y simplificar el ciclo de vida de MLOps e IA con Watson Studio pipelines (Beta).

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Interconexiones (Beta) Utilice las interconexiones en Watson Studio para crear flujos repetibles y planificados que automatizan el cuaderno, Data Refinery, y las interconexiones de aprendizaje de máquina, desde la ingestión de datos hasta el entrenamiento de modelos, las pruebas y el despliegue. Desea automatizar cualquiera o todos los pasos del flujo MLOps.


Ejemplo: Ciclo de vida de ML automatizado de Golden Bank

Los científicos de datos de Golden Bank también pueden utilizar pipelines para automatizar su ciclo de vida completo de MLOps and trustworthy AI y procesos para simplificar el proceso de aprobación de hipotecas.


Guías de aprendizaje para MLOps and trustworthy AI

Guía de aprendizaje Descripción Experiencia para guía de aprendizaje
Crear y desplegar un modelo Entrenar un modelo, promocionarlo a un espacio de despliegue y desplegar el modelo. Ejecutar un cuaderno.
Probar y validar el modelo Evalúe un modelo para ver su precisión, equidad y explicabilidad. Ejecutar un cuaderno y ver los resultados en la interfaz de usuario.

Más información

Tema padre: Visión general de la solución de entramado de datos