Puede utilizar el Prompt Lab para chatear con documentos proporcionando un índice vectorial. Cuando despliega su trabajo como un servicio AI, la lógica de su aplicación RAG se captura automáticamente en un activo de servicio AI y se crea un despliegue en línea para el activo.
Antes de empezar
- Debe disponer de un espacio de despliegue de destino existente o crear uno nuevo en el que desee desplegar su activo de servicio AI.
- Debe crear un índice vectorial (almacén vectorial en memoria o base de datos vectorial) para chatear con los documentos. Para más información, consulta Chatear con documentos e imágenes.
- Debe configurar sus credenciales de tarea generando una clave API. Para obtener más información, consulte Gestión de credenciales de tareas.
Creación de un despliegue en línea para servicios de IA
Siga estos pasos para crear una implantación en línea para un servicio de IA desde la interfaz de usuario del laboratorio watsonx.ai Prompt:
Desde tu proyecto, abre el laboratorio de avisos y chatea con los documentos para construir una solución RAG. Para más información, consulta Chatear con documentos e imágenes.
Para desplegar su trabajo como un servicio AI, haga clic en Desplegar.
En el cuadro de diálogo Despliegue como servicio AI, introduzca los detalles de su despliegue:
a. Introduzca un nombre para su despliegue de servicios AI.
b. Seleccione un proyecto de destino o un espacio de despliegue en el menú desplegable.
c. Opcional: Proporcione una descripción y seleccione la casilla de verificación si desea ver el activo de servicio AI en el proyecto después de desplegarlo.Pulse Desplegar.
Este procedimiento crea automáticamente un despliegue en línea para su activo de servicio AI en su proyecto o espacio de despliegue. Para crear un despliegue por lotes para su activo de servicio AI, debe seguir el proceso para crear manualmente un despliegue por lotes desde su espacio de despliegue. Para obtener más información, consulte Despliegue de activos de servicio de AI.
Más información
Despliegue de servicios de IA desde Prompt Lab con blocs de notas
Tema principal: Despliegue de servicios de IA con Prompt Lab