Con IBM watsonx.ai Runtime, puede desplegar modelos de aprendizaje automático, scripts, funciones . Después de crear despliegues, puede probarlos y gestionarlos, y preparar los activos para desplegarlos en entornos de preproducción y producción para generar predicciones y conocimientos.
Servicio El administrador debe aprovisionar el servicio watsonx.ai Runtime en la plataforma Cloud Pak for Data as a Service para utilizar sus capacidades.
Proceso de despliegue
El proceso típico para desplegar un activo es el siguiente:
- Elegir tipo de despliegue: elija un tipo de despliegue para el tipo de activo que desea desplegar.
- Crear despliegue: en función del tipo de activo, puede crear un despliegue en línea, por lotes, aplicación o desconectado.
- Despliegue de prueba: puede probar los despliegues especificando datos de prueba, proporcionando carga útil JSON o creando un trabajo por lotes.
- Recuperar punto final de despliegue: para utilizar el despliegue en una aplicación, debe recuperar el punto final del despliegue. El punto final de modelo proporciona acceso a una interfaz para invocar y gestionar despliegues de modelo.
El gráfico siguiente muestra el proceso para desplegar activos de IA:
Tipos de despliegues
Los tipos más comunes de despliegues son los siguientes:
Despliegue en línea: cree un despliegue en línea para procesar los datos de entrada en tiempo real. Para probar el despliegue en línea en tiempo real, puede enviar nuevos datos de cliente al punto final de despliegue para obtener una predicción en tiempo real.
Despliegue por lotes: Cree un despliegue por lotes para procesar un lote grande de datos de entrada de un origen de datos y escriba la salida en un destino seleccionado. Puede configurar el trabajo de despliegue por lotes y ejecutar el trabajo según una planificación o bajo demanda.
Tipos de activos desplegables
El tipo de activo que despliega dicta el tipo de despliegue que puede crear. Por ejemplo, las funciones, scripts y modelos de Python , como los modelos AutoAI o Decision Optimization , dan soporte a despliegues en línea y por lotes. Sin embargo, puede crear despliegues en línea sólo para los modelos que se importan de un archivo. Los distintos tipos de activos desplegables son los siguientes:
- 'watsonx.ai ' Activos en tiempo de ejecución: ' Puede desplegar activos de machine learning ' watsonx.ai Runtime como funciones ' Python, aplicaciones R Shiny, modelos NLP, scripts y más con ' watsonx.ai Runtime.
- Modelos deDecision Optimization: Puede desplegar el modelo de Decision Optimization Decisiones con watsonx.ai Runtime.
Formas de desplegar activos
Puede desplegar y gestionar los activos de las siguientes maneras:
Desplegar y gestionar activos en un espacio de despliegue utilizando un enfoque sin código.
Desplegar y gestionar activos mediante programación utilizando un enfoque de código personalizado.
Despliegue y gestión de activos en espacios de despliegue
Cree un espacio de despliegue para colaborar con las partes interesadas y desplegar y gestionar activos en un espacio de despliegue.
Para gestionar los activos dentro de un espacio de despliegue, debe promocionar los activos de un proyecto a su espacio de despliegue. También puede importar o exportar activos desde el espacio de despliegue.
Utilice el panel de control de despliegues para obtener una vista agregada de los despliegues y supervisar la actividad de despliegue.
Despliegue y gestión de activos mediante programación
Puede desplegar y gestionar activos utilizando la biblioteca de cliente Python o la API de tiempo de ejecución watsonx.ai. Para obtener más información, consulte Despliegue de activos de IA mediante programación.
Gestión de infraestructuras y especificaciones de software para despliegues
Especificaciones de software e infraestructuras contienen paquetes compuestos de paquetes con las versiones correspondientes de los paquetes.
Puede utilizar especificaciones de software predefinidas o crear especificaciones de software personalizadas añadiendo nuevos paquetes a infraestructuras existentes, crear nuevos paquetes o actualizar versiones de paquetes en especificaciones de software.
Más información
Tema padre: Despliegue y gestión de activos de IA