Traducción no actualizada
Planificación del flujo de trabajo de implantación de su solución de aprendizaje automático
creado: "2025-03-26 10:21:08 -0700" title: "Planificación del flujo de trabajo para una solución de aprendizaje automático" fname: " getting-started\plan-workflow-ml.liquid.md "
Cuando tenga una estrategia para su solución de aprendizaje automático, podrá planificar un flujo de trabajo que contenga las tareas que debe completar.
La siguiente tabla enumera las tareas de alto nivel que puede incluir en su plan y si cada tarea es obligatoria, recomendada, opcional o a veces necesaria en función de sus necesidades. Algunas tareas son necesarias sólo en algunas situaciones, pero se recomiendan para todas las situaciones.
Tarea | ¿Obligatorio? |
---|---|
Definir un caso de uso de la IA | A veces, Recomendado |
Desarrollar flujos de trabajo de gobernanza | A veces |
Configurar un proyecto | Obligatorio |
Preparar datos | A veces |
Entrene su modelo de aprendizaje automático | Obligatorio |
Evalúe su modelo de aprendizaje automático | A veces, Recomendado |
Implante su solución | Obligatorio |
Automatizar canalizaciones | A veces |
Supervise y mantenga su solución | A veces, Recomendado |
Definir un caso de uso de la IA
Un caso de uso de IA consiste en un conjunto de fichas que contienen el linaje, la historia y otra información relevante sobre el ciclo de vida de un activo de IA, como un modelo.
Su organización puede exigirle que realice un seguimiento y documente su solución de IA por motivos de transparencia o cumplimiento de la normativa. Sin embargo, los casos de uso de IA son útiles incluso cuando no son necesarios, ya que proporcionan una forma integrada de realizar un seguimiento del progreso, las decisiones y las métricas sobre su solución.
Para crear un caso de uso de IA, primero cree un inventario y, a continuación, cree el caso de uso. Añada científicos de datos, ingenieros de datos y otros usuarios que participen en la creación, las pruebas o el gobierno de su solución como colaboradores de casos de uso.
Más información sobre la definición de un caso de uso de IA
Desarrollo de flujos de trabajo de gobernanza
Un flujo de trabajo de gobernanza impone un proceso de revisión y aprobación para los casos de uso de IA y el uso de modelos.
Su organización puede necesitar uno o más de los siguientes tipos de flujos de trabajo de gobernanza:
- Flujos de trabajo de gobernanza del riesgo de modelo para aprobar casos de uso de IA, aprobar eventos del ciclo de vida del modelo básico, ejecutar evaluaciones de riesgo o automatizar la supervisión del rendimiento de los modelos.
- Flujos de trabajo de gestión del cumplimiento normativo para procesar las alertas publicadas por los organismos reguladores.
- Flujos de trabajo de gestión del riesgo operativo para realizar un seguimiento del riesgo de modelo junto con otros riesgos operativos en toda la empresa.
Para establecer un flujo de trabajo de gobernanza, debe configurarlo en la consola de Gobernanza.
Más información sobre el desarrollo de flujos de trabajo de gobernanza
Crear un proyecto
Un proyecto es un espacio de trabajo colaborativo en el que las personas trabajan con modelos y datos para cumplir un objetivo compartido.
Necesitas un proyecto para preparar datos, realizar experimentos y construir modelos de aprendizaje automático.
Un proyecto para una solución de aprendizaje automático suele contener los siguientes tipos de elementos que, o bien añaden explícitamente los científicos de datos o los ingenieros de IA, o bien se crean como resultado de un proceso:
- Activos de conexión a fuentes de datos, como el lugar donde almacena los datos de entrenamiento.
- Activos de datos que representan conjuntos de datos para modelos de entrenamiento.
- Cuadernos creados por el usuario o generados por procesos como la ejecución de un experimento en AutoAI.
- Experimente y fluya activos que cree a partir de herramientas en funcionamiento, como AutoAI, SPSS Modeler, o Decision Optimization.
- Trabajos que se crean ejecutando activos en herramientas.
Tienes un proyecto sandbox creado automáticamente. Sin embargo, es posible que desee crear un proyecto con un nombre que refleje su objetivo. Puede crear un proyecto desde la página de inicio o desde el menú de navegación. Añade a todas las personas que quieras que trabajen en la solución. Asigna un rol a cada colaborador para controlar sus permisos en el proyecto.
Más información sobre la creación de proyectos
Preparación de los datos
La preparación de datos implica proporcionar acceso a los datos necesarios en el formato y con el nivel de calidad que su solución necesita.
Debe proporcionar los datos de entrenamiento para su modelo de aprendizaje automático. Sus datos de entrenamiento deben incluir datos etiquetados para que la columna pueda predecir o clasificar con un algoritmo de aprendizaje automático. También puede proporcionar conjuntos de datos holdout sin etiquetar o conjuntos de datos backtest. Puede que necesite limpiar o dar forma a sus datos para prepararlos para el análisis y el entrenamiento de modelos.
Puede proporcionar datos de entrenamiento de las siguientes maneras:
- Cargar un archivo desde su sistema local
- Conectar con la fuente de datos que contiene el conjunto de datos
Puede preparar sus datos con herramientas de preparación de datos y luego utilizar esos datos en otras herramientas como AutoAI o cuadernos:
- Cargue sus archivos de datos o conéctese a las tablas de sus fuentes de datos.
- Limpie, modele y visualice sus datos con Data Refinery.
- Genere datos tabulares sintéticos basados en datos de producción o en un esquema de datos personalizado con Synthetic Data Generator.
Puede preparar sus datos con la misma herramienta con la que entrena el modelo de aprendizaje automático:
- Limpie, transforme, reduzca, integre y valide sus datos en SPSS Modeler.
- Llame a las bibliotecas de código abierto y IBM preinstaladas o instale y llame a bibliotecas personalizadas en los blocs de notas.
Más información sobre la preparación de datos
Entrene su modelo de aprendizaje automático
Un modelo de aprendizaje automático se entrena con un conjunto de datos para desarrollar algoritmos que pueda utilizar para analizar y aprender de nuevos datos.
Puede experimentar con el entrenamiento de su modelo de aprendizaje automático alterando las condiciones de las siguientes maneras:
- Probar diferentes algoritmos para ajustar mejor los datos
- Seleccionar y escalar las características para representar mejor el problema
- Ajustar la configuración de los hiperparámetros para optimizar el rendimiento y la precisión
Para construir un modelo de aprendizaje automático, puede experimentar con el código Python en cuadernos. Para automatizar la búsqueda de algoritmos, transformaciones y ajustes de parámetros para crear el mejor modelo predictivo, ejecute un experimento de Auto AI para aprendizaje automático. Para explorar sus datos, modelizar resultados, probar diferentes modelos e investigar relaciones para encontrar información útil, construya un flujo SPSS Modeler. Para resolver un problema empresarial de optimización, construya un modelo Decision Optimization.
Más información sobre la formación de modelos de aprendizaje automático
Evaluación de sus activos de aprendizaje automático
La evaluación de un modelo de aprendizaje automático pone a prueba la calidad del resultado del modelo para el conjunto de métricas que se elija. Algunas métricas se basan en la comparación de los resultados del modelo con los resultados apropiados que usted proporciona en el conjunto de datos de prueba. También se evalúa la eficacia con la que su modelo genera respuestas.
Es posible que su organización necesite evaluaciones para cumplir la normativa o por políticas internas. Sin embargo, las evaluaciones son útiles incluso cuando no son necesarias, ya que las puntuaciones de las métricas pueden indicar la calidad de su solución y podrían predecir un descenso de la satisfacción del usuario cuando las puntuaciones descienden.
Al evaluar un activo de IA, puede configurar los siguientes factores:
- Tamaño de la muestra
- Qué métricas incluir
- El valor umbral de cada métrica
Las métricas generales proporcionan los siguientes tipos de información sobre el modelo de aprendizaje automático:
- Rendimiento del modelo en comparación con un conjunto de pruebas etiquetado.
- Si el modelo produce resultados sesgados.
- Cambios en la precisión y los datos.
- Eficacia con la que el modelo procesa las transacciones.
Puede ver los resultados actuales y los resultados a lo largo del tiempo. Los resultados de cada evaluación se añaden al caso de uso del indicador.
Para evaluar un modelo de aprendizaje automático, abra el panel Insights desde Watson OpenScale. Si ejecuta un experimento de aprendizaje automático en AutoAI, los modelos candidatos se evalúan y clasifican automáticamente.
Más información sobre la evaluación de activos de aprendizaje automático
Implantación de la solución
El despliegue de un activo hace que esté disponible para pruebas o para su uso productivo por parte de un punto final. Una vez creadas las implantaciones, puede probarlas y gestionarlas, y preparar sus activos para implantarlos en entornos de preproducción y producción.
Los despliegues se crean en espacios de despliegue, que son espacios de trabajo distintos de los proyectos y a los que se puede añadir un conjunto diferente de colaboradores.
Para desplegar activos de modelos de aprendizaje automático, debe promover el activo a un espacio de despliegue y crear un despliegue que contenga un punto final. A continuación, puede llamar al endpoint desde su aplicación. Puede crear espacios de implantación independientes para las implantaciones de prueba, de ensayo y de producción, con el fin de respaldar su flujo de trabajo en ModelOps.
Más información sobre el despliegue de activos de IA
Automatización de los procesos de aprendizaje automático
Después de entrenar y desplegar su modelo de aprendizaje automático, puede automatizar el proceso de entrenamiento, despliegue y evaluación del modelo. Puede comparar los resultados de varios modelos de aprendizaje automático para determinar cuál es el mejor. Puede configurar la calificación automatizada por lotes a escala.
Puede configurar una canalización para que realice las siguientes tareas:
- Añadir activos a su pipeline o exportar activos de pipeline
- Crear o eliminar activos, despliegues o espacios de despliegue
- Añadir gestión de errores y lógica, como bucles
- Establecer variables de usuario
- Sustituir o actualizar los activos para mejorar el rendimiento
- Ejecutar un trabajo para entrenar un experimento, ejecutar un script o ejecutar un flujo de datos
- Especificar las condiciones de ejecución del flujo
- Ejecutar un script escrito por usted
Para diseñar una canalización, arrastre los nodos al lienzo del editor de canalizaciones, especifique los objetos y parámetros y, a continuación, ejecute y supervise la canalización.
Más información sobre canales de aprendizaje automático
Supervisión y mantenimiento de su solución
Después de integrar su solución en su aplicación y ponerla en producción, debe mantenerla. También puedes controlar el rendimiento del modelo. El mantenimiento de su solución puede incluir el reentrenamiento de su modelo de aprendizaje automático con datos recientes. La supervisión de su solución evalúa el rendimiento del modelo en su entorno de producción.
Su organización puede exigirle que supervise su solución y se asegure de que el rendimiento no cae por debajo de los umbrales especificados.
Para supervisar su solución, abra el despliegue de su solución en el espacio de despliegue y active las evaluaciones. Puede utilizar el punto final de registro de carga útil para enviar solicitudes de puntuación para evaluaciones de imparcialidad y deriva y utilizar el punto final de registro de comentarios para proporcionar datos de comentarios para evaluaciones de calidad.
Más información sobre la supervisión y el mantenimiento de su solución
Tema principal: Planificación de una solución de IA generativa