0 / 0
Volver a la versión inglesa de la documentación
Despliegue de activos de IA
Última actualización: 21 nov 2024
Despliegue de activos de IA

Con IBM watsonx.ai Runtime, puede desplegar modelos de aprendizaje automático, scripts, funciones . Después de crear despliegues, puede probarlos y gestionarlos, y preparar los activos para desplegarlos en entornos de preproducción y producción para generar predicciones y conocimientos.

Servicio El administrador debe aprovisionar el servicio watsonx.ai Runtime en la plataforma Cloud Pak for Data as a Service para utilizar sus capacidades.

Proceso de despliegue

El proceso típico para desplegar un activo es el siguiente:

  1. Elegir tipo de despliegue: elija un tipo de despliegue para el tipo de activo que desea desplegar.
  2. Crear despliegue: en función del tipo de activo, puede crear un despliegue en línea, por lotes, aplicación o desconectado.
  3. Despliegue de prueba: puede probar los despliegues especificando datos de prueba, proporcionando carga útil JSON o creando un trabajo por lotes.
  4. Recuperar punto final de despliegue: para utilizar el despliegue en una aplicación, debe recuperar el punto final del despliegue. El punto final de modelo proporciona acceso a una interfaz para invocar y gestionar despliegues de modelo.

El gráfico siguiente muestra el proceso para desplegar activos de IA:

Detalles del despliegue

Tipos de despliegues

Los tipos más comunes de despliegues son los siguientes:

  • Despliegue en línea: cree un despliegue en línea para procesar los datos de entrada en tiempo real. Para probar el despliegue en línea en tiempo real, puede enviar nuevos datos de cliente al punto final de despliegue para obtener una predicción en tiempo real.

  • Despliegue por lotes: Cree un despliegue por lotes para procesar un lote grande de datos de entrada de un origen de datos y escriba la salida en un destino seleccionado. Puede configurar el trabajo de despliegue por lotes y ejecutar el trabajo según una planificación o bajo demanda.

Tipos de activos desplegables

El tipo de activo que despliega dicta el tipo de despliegue que puede crear. Por ejemplo, las funciones, scripts y modelos de Python , como los modelos AutoAI o Decision Optimization , dan soporte a despliegues en línea y por lotes. Sin embargo, puede crear despliegues en línea sólo para los modelos que se importan de un archivo. Los distintos tipos de activos desplegables son los siguientes:

Formas de desplegar activos

Puede desplegar y gestionar los activos de las siguientes maneras:

Despliegue y gestión de activos en espacios de despliegue

Cree un espacio de despliegue para colaborar con las partes interesadas y desplegar y gestionar activos en un espacio de despliegue.

Para gestionar los activos dentro de un espacio de despliegue, debe promocionar los activos de un proyecto a su espacio de despliegue. También puede importar o exportar activos desde el espacio de despliegue.

Utilice el panel de control de despliegues para obtener una vista agregada de los despliegues y supervisar la actividad de despliegue.

Despliegue y gestión de activos mediante programación

Puede desplegar y gestionar activos utilizando la biblioteca de cliente Python o la API de tiempo de ejecución watsonx.ai. Para obtener más información, consulte Despliegue de activos de IA mediante programación.

Gestión de infraestructuras y especificaciones de software para despliegues

Especificaciones de software e infraestructuras contienen paquetes compuestos de paquetes con las versiones correspondientes de los paquetes.

Puede utilizar especificaciones de software predefinidas o crear especificaciones de software personalizadas añadiendo nuevos paquetes a infraestructuras existentes, crear nuevos paquetes o actualizar versiones de paquetes en especificaciones de software.

Más información

Espacios de despliegue

Tema padre: Despliegue y gestión de activos de IA

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información