Utilice los modelos de inclusión para crear incorporaciones de texto que capturen el significado de una frase o pasaje para ayudar con las tareas de generación aumentadas de recuperación.
La generación aumentada por recuperación (RAG, por sus siglas en inglés) es una técnica en la que un foundation model se aumenta con conocimientos procedentes de fuentes externas. Puede utilizar incrustaciones de texto para encontrar información relevante de mayor calidad e incluirla en la pregunta para ayudar al foundation model a responder de forma objetiva.
El diagrama siguiente ilustra el patrón de generación de recuperación aumentada con soporte de inclusión.
El patrón de generación de recuperación aumentada con soporte de inclusión implica los pasos siguientes:
- Convierta el contenido en incorporaciones de texto y almacénelas en un almacén de datos de vector.
- Utilice el mismo modelo de inclusión para convertir la entrada de usuario en incorporaciones de texto.
- Ejecute una búsqueda semántica o de similitud en la base de conocimientos para el contenido relacionado con la pregunta de un usuario.
- Extraiga los resultados de búsqueda más relevantes en su solicitud como contexto y añada una instrucción, como por ejemplo "Responder a la siguiente pregunta utilizando sólo información de los pasajes siguientes".
- Enviar el texto de consulta combinado (instrucción + resultados de búsqueda + pregunta) al foundation model.
- El foundation model utiliza la información contextual de la pregunta para generar una respuesta objetiva.
Aumentar la información del foundation model de Prompt Lab
Prompt Lab tiene una función incorporada en el modo de chat que le ayuda a implementar un caso de uso de RAG. Para comenzar, asocia los documentos relevantes con un mensaje. Los documentos que agrega se vectorizan y almacenan en una base de datos vectorial. Cuando se envía una consulta al chat, se busca en la base de datos y los resultados relacionados se incluyen en la entrada que se envía al foundation model. Para más información, consulte Basar las indicaciones foundation model en información contextual.
Cuaderno de ejemplo
El cuaderno de ejemplo Utilizar watsonx Granite Model Series, Chroma y LangChain para responder preguntas (RAG ) le guía por los pasos a seguir para mejorar un caso de uso RAG con incrustaciones.
Más información
- Modelos de inclusión soportados
- Generación aumentada de Retreival
- Vectorización de texto mediante la API
- Técnicas para superar las limitaciones de longitud de contexto
- Referencia de la API de incrustación de texto
Tema principal: Generación aumentada por recuperación