Utilizando IBM Watson Machine Learning, puede desplegar modelos de aprendizaje de máquina, scripts y funciones, y solicitar plantillas para modelos de IA generativos. Después de crear despliegues, puede probarlos y gestionarlos, y preparar los activos para desplegarlos en entornos de preproducción y producción para generar predicciones y conocimientos.
Servicio El administrador debe suministrar el servicio Watson Machine Learning en la plataforma Cloud Pak for Data as a Service para utilizar sus prestaciones.
Despliegue y gestión de activos en espacios de despliegue
Cree un espacio de despliegue para colaborar con las partes interesadas y desplegar y gestionar sus activos de IA. Para gestionar los activos dentro de un espacio de despliegue, debe promocionar los activos de un proyecto a su espacio de despliegue. También puede importar o exportar activos desde el espacio de despliegue. Para obtener más información, consulte Espacios de despliegue.
El gráfico siguiente muestra las actividades típicas para desplegar activos de IA:
Formas de desplegar activos
Puede desplegar y gestionar los activos de las siguientes maneras:
Utilizar un enfoque sin código: puede utilizar un enfoque sin código para desplegar y gestionar activos en un espacio de despliegue. Para obtener más información, consulte Despliegue y gestión de activos en espacios de despliegue
Utilizar un enfoque de código personalizado Puede utilizar un enfoque de código personalizado para desplegar y gestionar activos mediante programación utilizando:
Para las API de Cloud Pak for Data as a Service adicionales, consulte API deCloud Pak for Data.
Tipos de despliegues
En función de las necesidades de su organización, puede crear un despliegue en línea o por lotes:
Despliegue en línea: cree un despliegue en línea para procesar los datos de entrada en tiempo real. Para probar el despliegue en línea en tiempo real, puede enviar nuevos datos de cliente al punto final de despliegue para obtener una predicción en tiempo real. Puede probar el despliegue en línea especificando datos de prueba en un formulario o mediante código JSON. Para obtener más información, consulte Creación de despliegues en línea en Watson Machine Learning.
Despliegue por lotes: Cree un despliegue por lotes para procesar un lote grande de datos de entrada de un origen de datos y escriba la salida en un destino seleccionado. Para probar el despliegue por lotes, debe crear un trabajo de despliegue por lotes. Puede configurar el trabajo de despliegue por lotes proporcionando detalles sobre los datos de entrada, el archivo de salida e información sobre la ejecución del trabajo en una planificación o bajo demanda. Para obtener más información, consulte Creación de despliegues por lotes en Watson Machine Learning.
Despliegue de aplicación: cree un despliegue de aplicación para desplegar los activos de aplicación, como por ejemplo aplicaciones R Shiny. Para obtener más información, consulte Despliegue de aplicaciones Shiny en Watson Machine Learning.
Recuperación de puntos finales de despliegue
Para utilizar su activo desplegado en aplicaciones para realizar predicciones, recupere la URL del punto final para su despliegue en línea o por lotes. El punto final de modelo proporciona acceso a una interfaz para invocar y gestionar despliegues de modelo.
Para obtener más información, consulte Recuperación del punto final para un despliegue en línea o Recuperación del punto final para un despliegue por lotes.
Tipos de activos desplegables
Solo puede utilizar determinados activos para crear despliegues en línea o por lotes. Por ejemplo, los despliegues en línea y por lotes dan soporte al despliegue de activos como, por ejemplo, funciones, scripts y modelos de Python , como AutoAI o modelos de Decision Optimization . Sin embargo, puede crear despliegues en línea sólo para los modelos que se importan de un archivo. Los distintos tipos de activos desplegables son los siguientes:
- Activos de modelo de base: puede desplegar activos de modelo de base como, por ejemplo, el modelo ajustado o los activos de plantilla de solicitud con watsonx.ai. Para obtener más información, consulte Despliegue de activos de modelo de base.
- Activos de Machine Learning : puede desplegar activos de machine learning Machine Learning como, por ejemplo, funciones de Python , aplicaciones R Shiny, modelos NLP, scripts, etc. con Watson Machine Learning. Para obtener más información, consulte Despliegue de activos de Machine Learning.
- Modelos de Decision Optimization : puede desplegar el modelo de Decision Optimization con Watson Machine Learning.
Gestión de despliegues
Puede acceder, actualizar, escalar, suprimir y supervisar el rendimiento del despliegue en el espacio de despliegue:
- Acceso a un despliegue: puede acceder a detalles relacionados con el despliegue, como el tipo de etapa, que describe si el espacio de despliegue es para fines de preproducción o producción.
- Actualización de un despliegue: puede actualizar los detalles del despliegue como, por ejemplo, el nombre de despliegue, la especificación de software, etc. Para obtener más información, consulte Actualización de un despliegue.
- Escalado de un despliegue: puede crear varias copias del despliegue para aumentar la escalabilidad y la disponibilidad para un mayor volumen de solicitudes de puntuación. Para obtener más información, consulte Escalado de un despliegue.
- Supresión de un despliegue: suprima el despliegue cuando ya no lo necesite para liberar recursos. Para obtener más información, consulte Supresión de un despliegue.
- Supervisar el rendimiento del despliegue: puede evaluar los despliegues para medir el rendimiento y comprender las predicciones del modelo suministrando una instancia de Watson OpenScale y configurando supervisores de equidad, calidad, desviación y explicabilidad.
Supervisión de la actividad de despliegue
Utilice el panel de control de despliegues para obtener una vista agregada de los despliegues y supervisar la actividad de despliegue. Puede utilizar el panel de control para supervisar el estado de los trabajos de despliegue por lotes, como por ejemplo las ejecuciones activas y las ejecuciones finalizadas en función de la planificación de trabajos que haya definido al crear el trabajo. También puede obtener información sobre el número de despliegues en línea satisfactorios y fallidos. Para obtener más información, consulte Panel de control Despliegues.
Gestión de entornos de ejecución para despliegues
Los entornos de ejecución proporcionan las funciones necesarias para ejecutar el despliegue.
Puede utilizar entornos de ejecución predefinidos o crear entornos de ejecución personalizados para incluir más componentes, en función de su caso de uso. Para crear un entorno de ejecución personalizado para su despliegue, debe crear un Dockerfile y añadir una imagen base. Además, puede añadir los mandatos docker
para crear el entorno de ejecución para el despliegue. Para obtener más información, consulte Personalización de los tiempos de ejecución de despliegue de Watson Machine Learning.
Gestión de infraestructuras y especificaciones de software para despliegues
Las especificaciones de software y las infraestructuras contienen paquetes de paquetes con las versiones correspondientes de los paquetes.
Puede utilizar especificaciones de software predefinidas o crear especificaciones de software personalizadas, en función de su caso de uso. Por ejemplo, puede añadir nuevos paquetes a las infraestructuras existentes, crear nuevos paquetes o sustituir versiones de paquete de las especificaciones de software.
Debe actualizar las especificaciones de software del modelo a la versión más reciente después del desuso para asegurarse de que el servicio continúa. Cuando una infraestructura está en desuso, el soporte para esta infraestructura se elimina en un futuro release.
Para obtener más información, consulte Infraestructuras y especificaciones de software en Watson Machine Learning.
Más información
Tema padre: Despliegue y gestión de activos de IA