Utilización de texto vectorizado con tareas de generación aumentada de recuperación

Última actualización: 04 mar 2025

Utilice los modelos de inclusión para crear incorporaciones de texto que capturen el significado de una frase o pasaje para ayudar con las tareas de generación aumentadas de recuperación.

La generación aumentada por recuperación (RAG) es una técnica en la que un modelo de base se amplía con conocimientos de fuentes externas. Puede utilizar incrustaciones de texto para encontrar información relevante de mayor calidad que incluir con la pregunta para ayudar al modelo de la fundación a responder con hechos.

El diagrama siguiente ilustra el patrón de generación de recuperación aumentada con soporte de inclusión.

Diagrama que muestra la adición de resultados de búsqueda derivados de un almacén de vectores a la entrada para la recuperación-generación aumentada

El patrón de generación de recuperación aumentada con soporte de inclusión implica los pasos siguientes:

Convierta el contenido en incorporaciones de texto y almacénelas en un almacén de datos de vector.
Utilice el mismo modelo de inclusión para convertir la entrada de usuario en incorporaciones de texto.
Ejecute una búsqueda semántica o de similitud en la base de conocimientos para el contenido relacionado con la pregunta de un usuario.
Extraiga los resultados de búsqueda más relevantes en su solicitud como contexto y añada una instrucción, como por ejemplo "Responder a la siguiente pregunta utilizando sólo información de los pasajes siguientes".
Envía el texto de aviso combinado (instrucción + resultados de búsqueda + pregunta) al modelo de base.
El modelo de la fundación utiliza información contextual de la pregunta para generar una respuesta objetiva.

Aumentar la entrada del modelo de base de Prompt Lab

Prompt Lab tiene una función integrada en el modo de chat que te ayuda a implementar un caso de uso de RAG. Para comenzar, asocia los documentos relevantes con un mensaje. Los documentos que agrega se vectorizan y almacenan en una base de datos vectorial. Cuando se envía una consulta al chat, se busca en la base de datos y los resultados relacionados se incluyen en la entrada que se envía al modelo de la base. Para obtener más información, consulte las indicaciones del modelo de base de conexión a tierra en la información contextual.

Cuaderno de ejemplo

El cuaderno de ejemplo Utilizar watsonx Granite Model Series, Chroma y LangChain para responder preguntas (RAG ) le guía por los pasos a seguir para mejorar un caso de uso RAG con incrustaciones.

Más información

Tema principal: Generación aumentada por recuperación

¿Fue útil el tema?

0/1000

Aumentar la entrada del modelo de base de Prompt LabCopy link to section

Cuaderno de ejemploCopy link to section

Más informaciónCopy link to section

Aumentar la entrada del modelo de base de Prompt Lab

Cuaderno de ejemplo

Más información