Guardar un patrón RAG
Guarde una línea de experimentos de generación aumentada por recuperación (RAG) cuadernos generados automáticamente que puede utilizar para indexar, recuperar y generar con el patrón RAG.
Guardar un patrón RAG como cuadernos autogenerados
Después de ejecutar un experimento, puede revisar los patrones generados que se clasifican en la tabla de clasificación según el rendimiento con respecto a la métrica optimizada. Cuando esté satisfecho con un patrón, puede guardarlo, generando uno o dos cuadernos guardados como activos del proyecto. Si crea un experimento en Milvus, también tiene la opción de desplegarlo inmediatamente como un activo de IA.
Los cuadernos que se generan para un patrón RAG guardado dependen del almacén de vectores utilizado para el experimento, como se indica a continuación:
- El cuaderno de índices rellena, actualiza y mantiene el índice vectorial de la colección de documentos. Todos los patrones RAG AutoAI pueden generar un cuaderno de indexación.
- El cuaderno de inferencia proporciona un punto final para inferir sobre un modelo lingüístico de gran tamaño con las capacidades de recuperación aumentadas. Sólo los experimentos que utilizan una base de datos Milvus como almacén de vectores generan un cuaderno de inferencias.
Para un experimento de Milvus, un servicio de IA empaqueta una canalización para su despliegue inmediato en un espacio de despliegue, donde se puede inferir sobre el punto final.
Generación de los cuadernos de indización e inferencia
Después de revisar sus pipelines, siga estos pasos para guardar un pipeline y generar los cuadernos asociados.
- En la tabla de clasificación de experimentos, haga clic en el nombre de una canalización para ver los detalles.
- Pulse Guardar. El panel muestra la libreta o libretas que se generan automáticamente. Por ejemplo, la siguiente imagen muestra el panel de guardado de un patrón creado utilizando la base de datos Chroma en memoria como almacén de vectores.
- Pulse Crear.
- Abra los cuadernos del proyecto asociado para revisar o ejecutar el código. Por ejemplo, el cuaderno de indexación tiene el siguiente aspecto:
Puedes revisar los cuadernos o ejecutarlos añadiendo credenciales de autenticación.
Revisar el cuaderno índice
El cuaderno de índices contiene código Python para construir el índice de la base de datos vectorial para su colección de documentos.
El cuaderno está anotado para que puedas repasar los pasos y el código para:
- Recuperar los datos para vectorizar
- Agrupar los datos
- Creación de las incrustaciones
- Lectura de los datos de referencia
- Uso de los datos de referencia para evaluar la calidad de la recuperación
Revisar el cuaderno de inferencias
El cuaderno de inferencia contiene código Python para:
- Recuperar los pasajes pertinentes de los documentos indexados para cada consulta del usuario
- Generar una respuesta a cada consulta del usuario introduciendo los pasajes recuperados en un gran modelo lingüístico para su uso en la respuesta generada
El cuaderno está anotado para que puedas repasar los pasos y el código para:
- Construcción de la función Python de inferencia utilizando el patrón RAG identificado en el experimento
- Despliegue de la función como punto final de inferencia
- Comprobación de la recuperación de pasajes relevantes como entrada para la respuesta generada
Ejecute el cuaderno de inferencias para utilizar el patrón RAG para recuperar y generar respuestas a las preguntas.
Guardar un patrón RAG como servicio AI desplegable
Puede guardar su patrón RAG como un servicio de IA implementable. Un servicio de IA:
- Es una función desplegable de Python que captura la lógica del patrón RAG.
- Crea un activo de proyecto.
- Opcionalmente, promueve una copia del activo a un espacio de despliegue y crea el despliegue para que pueda acceder al endpoint e inferir el patrón.
Para crear y desplegar el servicio AI:
- Seleccione Guardar como para el patrón RAG.
- Elija Recuperación y generación como objetivo.
- Elija el servicio AI como tipo de activo.
- Seleccione Promote (Promocionar) y depl0y (Instalar servicio de IA en espacio de implementación ).
- Haga clic en Crear e implantar.
- Seleccione un espacio de despliegue existente o cree uno nuevo.
Cuando finalice el proceso de despliegue, haga clic en el nombre del despliegue para abrir el servicio de IA para su comprobación. Desde el despliegue, puedes:
- Obtenga el punto final y los fragmentos de código de la pestaña de referencia de la API para utilizar el patrón RAG en una aplicación.
- Cambie a la pestaña Test para introducir o cargar nuevas preguntas en formato JSON para utilizarlas con el patrón RAG. Utilice el mismo formato JSON que utilizó para las preguntas de evaluación, pero no proporcione las respuestas.
Para obtener más información, consulte Implementación de servicios de IA
Más información
Utilice los documentos indexados de este experimento en el Prompt Lab para obtener indicaciones básicas para un modelo de fundación. Consulte Uso de un índice de fragmentos de texto ( AutoAI ) para chatear con documentos.
Tema principal: Creación de un experimento RAG