Con IBM watsonx.ai Runtime, puede desplegar modelos de aprendizaje automático, scripts, funciones y plantillas de avisos para modelos de IA generativa. Después de crear despliegues, puede probarlos y gestionarlos, y preparar los activos para desplegarlos en entornos de preproducción y producción para generar predicciones y conocimientos.
Servicio El administrador debe aprovisionar el servicio watsonx.ai Runtime en la plataforma watsonx para utilizar sus capacidades.
Proceso de despliegue
Copy link to section
El proceso típico para desplegar un activo es el siguiente:
Elegir tipo de despliegue: elija un tipo de despliegue para el tipo de activo que desea desplegar.
Crear despliegue: en función del tipo de activo, puede crear un despliegue en línea, por lotes, aplicación o desconectado.
Despliegue de prueba: puede probar los despliegues especificando datos de prueba, proporcionando carga útil JSON o creando un trabajo por lotes.
Recuperar punto final de despliegue: para utilizar el despliegue en una aplicación, debe recuperar el punto final del despliegue. El punto final de modelo proporciona acceso a una interfaz para invocar y gestionar despliegues de modelo.
El gráfico siguiente muestra el proceso para desplegar activos de IA:
Tipos de despliegues
Copy link to section
Los tipos más comunes de despliegues son los siguientes:
Despliegue en línea: cree un despliegue en línea para procesar los datos de entrada en tiempo real. Para probar el despliegue en línea en tiempo real, puede enviar nuevos datos de cliente al punto final de despliegue para obtener una predicción en tiempo real.
Despliegue por lotes: Cree un despliegue por lotes para procesar un lote grande de datos de entrada de un origen de datos y escriba la salida en un destino seleccionado. Puede configurar el trabajo de despliegue por lotes y ejecutar el trabajo según una planificación o bajo demanda.
Tipos de activos desplegables
Copy link to section
El tipo de activo que despliega dicta el tipo de despliegue que puede crear. Por ejemplo, las funciones, scripts y modelos de Python , como los modelos AutoAI o Decision Optimization , dan soporte a despliegues en línea y por lotes. Sin embargo, puede crear despliegues en línea sólo para los modelos que se importan de un archivo. Los distintos tipos de activos desplegables son los siguientes:
Activos del modelo base: Puede desplegar activos de foundation model de cimentación, como el modelo sintonizado, activos de plantilla rápida o modelos de cimentación personalizados con watsonx.ai.
'watsonx.ai ' Activos en tiempo de ejecución: ' Puede desplegar activos de machine learning ' watsonx.ai Runtime como funciones ' Python, aplicaciones R Shiny, modelos NLP, scripts y más con ' watsonx.ai Runtime.
Despliegue y gestión de activos en espacios de despliegue
Copy link to section
Cree un espacio de despliegue para colaborar con las partes interesadas y desplegar y gestionar activos en un espacio de despliegue.
Para gestionar los activos dentro de un espacio de despliegue, debe promocionar los activos de un proyecto a su espacio de despliegue. También puede importar o exportar activos desde el espacio de despliegue.
Utilice el panel de control de despliegues para obtener una vista agregada de los despliegues y supervisar la actividad de despliegue.
Despliegue y gestión de activos mediante programación
Copy link to section
Puede desplegar y gestionar activos utilizando la biblioteca de cliente Python o la API de tiempo de ejecución watsonx.ai. Para obtener más información, consulte Despliegue de activos de IA mediante programación.
Gestión de infraestructuras y especificaciones de software para despliegues
Puede utilizar especificaciones de software predefinidas o crear especificaciones de software personalizadas añadiendo nuevos paquetes a infraestructuras existentes, crear nuevos paquetes o actualizar versiones de paquetes en especificaciones de software.