Después de guardar una plantilla de solicitud como un activo de proyecto, puede promocionarla a un espacio de despliegue. Desde el espacio de despliegue, puede desplegar su plantilla de avisos a producción y obtener el punto final para la inferencia.
Si tiene el servicio watsonx.governance , también puede capturar y realizar un seguimiento de los detalles de despliegue para una plantilla de solicitud para cumplir los requisitos de gobierno.
Un servicio de IA es una unidad de código desplegable que captura la lógica de sus casos de uso de IA generativa, como la Generación Aumentada de Recuperación (RAG). Cuando sus servicios de IA se desplieguen correctamente, podrá utilizar el endpoint para inferir desde su aplicación.
Los servicios de IA se crean automáticamente cuando se implementa una solución de IA generativa compleja con herramientas visuales como Agent Lab, Prompt Lab o AutoAI. Por ejemplo, si utiliza Agent Lab o Prompt Lab para crear e implementar su solución de IA generativa o basada en agentes, la herramienta detecta automáticamente la complejidad de la solución y presenta el tipo correcto de activo de implementación.
Aunque puede utilizar las plantillas de mensajes para crear e implementar mensajes guardados en el Prompt Lab, no puede utilizarlas para implementar aplicaciones de IA generativa para casos de uso complejos como RAG.
Si decide codificar su aplicación de IA generativa basada en estos casos de uso complejos, deberá crear un servicio de IA y asegurarse de que sigue ciertos requisitos. Puede desplegar un servicio de IA mediante programación con la API REST watsonx.ai o la biblioteca de clientes Python. Después de desplegar el servicio AI, puede utilizar el endpoint para inferencias.
Después de ajustar un modelo de base y guardar el modelo ajustado como un activo de proyecto, puede promocionarlo a un espacio de implementaciones. Desde el espacio de despliegue, puede probar el modelo sintonizado y obtener el punto final para la inferencia.
Implantación de modelos de cimientos personalizados
Copy link to section
Además de trabajar con los modelos de base seleccionados por IBM, puede cargar y desplegar sus propios modelos de base. Una vez desplegados y registrados los modelos en watsonx.ai, cree avisos que inferencien los modelos personalizados desde Prompt Lab.
La implementación de un modelo de base personalizado le proporciona la flexibilidad necesaria para implementar las soluciones de IA adecuadas para su caso de uso.
Implementar un modelo de base bajo demanda en hardware dedicado para que el modelo de base esté disponible para su uso en diversas aplicaciones y servicios según sea necesario. Gracias a este enfoque, podrá acceder a las capacidades de estos potentes modelos de cimentación sin necesidad de grandes recursos computacionales. Los modelos Foundation que se despliegan a petición se alojan en un espacio de despliegue dedicado en el que se pueden utilizar estos modelos para inferencias.