Patrón de solución para responder preguntas con generación aumentada por recuperación

Última actualización: 07 mar 2025
Patrón de solución para responder preguntas con generación aumentada por recuperación

Puede crear una solución de IA generativa que responda a las preguntas de los usuarios basándose en la información de una base de conocimientos mediante la aplicación del patrón de generación aumentada por recuperación (RAG).

Caso de uso y requisitos

El patrón RAG es útil cuando se necesita un modelo de base para complementar las respuestas a las preguntas con la información que se proporciona. Por ejemplo, supongamos que desea implementar un chatbot para su nuevo producto que responda preguntas basadas en la documentación de su producto.

Una solución RAG que responda a preguntas basadas en la documentación del producto podría incluir estas tareas:

  • Encuentre la respuesta a la pregunta del usuario en la documentación del producto.
  • Generar respuestas basadas en la documentación del producto.
  • Enlace a los temas de la documentación que proporcionaron la respuesta.
  • Guarde todas las preguntas y respuestas.
  • Recopilar comentarios de los usuarios sobre las respuestas.
  • Entregar los comentarios negativos a los redactores de la documentación.

arquitectura de la solución

Un patrón RAG suele incluir los siguientes componentes:

  • Una base de conocimientos que contiene los documentos fuente.
  • Un modelo de incrustación que convierte el texto de los documentos en incrustaciones vectoriales, que son representaciones numéricas.
  • Una base de datos vectorial que almacena las incrustaciones vectoriales de sus documentos y el índice vectorial que busca y recupera el contenido.
  • Una plantilla rápida que combina la pregunta del usuario, el contenido recuperado y las instrucciones para generar una respuesta.
  • Un modelo de base que genera una respuesta a la pregunta de un usuario basada en el contenido recuperado.

«Imagen descrita en el texto circundante»

La solución completa también podría incluir los siguientes componentes:

  • Una aplicación con una interfaz de usuario en la que los usuarios pueden hacer preguntas, recibir respuestas y proporcionar comentarios sobre las respuestas.
  • Un modelo de reordenación que reordena los resultados recuperados en función de lo bien que responden a la pregunta, en lugar de lo similares que son los resultados a la pregunta.
  • Un registro de las preguntas, respuestas y comentarios de los usuarios.
  • Un método para enviar los comentarios a los redactores de la documentación, que pueden actualizarla para que la solución genere mejores respuestas.
  • Un método para identificar a los mejores expertos para responder a respuestas insatisfactorias.

Por ejemplo, el siguiente gráfico ilustra cómo puede optimizar su solución RAG adaptando su contenido para mejorar las respuestas de IA basadas en los comentarios de los usuarios.

«Imagen descrita en el texto circundante»

Implementación de la solución

Para implementar una solución de patrón RAG, siga estos pasos principales:

  1. Configurar una base de datos vectorial.
  2. Crear un índice vectorial.
  3. Especifique el índice del vector en el mensaje.
  4. Evalúe el aviso.
  5. Añadir componentes opcionales.
  6. Implementar el patrón como un servicio de IA.
  7. Llame al punto final del servicio de IA en su aplicación.

Herramientas

Puede crear una prueba de concepto rápida en el Prompt Lab. Puede cargar un archivo de documento y crear un índice vectorial para él en el almacén vectorial en memoria. Ver Conversar con documentos. Cuando configura una base de datos vectorial, puede crear un índice vectorial al que puede hacer referencia en un aviso. Consulte Adición de documentos vectorizados para obtener indicaciones sobre el modelo de base de conexión a tierra.

Puede poner en marcha su solución RAG con el acelerador de preguntas y respuestas con RAG. El acelerador es un proyecto de muestra que implementa un patrón RAG con un conjunto de cuadernos de notas ( Python ) que puede personalizar para su solución. Ver preguntas y respuestas con el acelerador RAG.

Puede automatizar la búsqueda del mejor patrón RAG, ejecutar la herramienta de optimización de la cadena de suministro ( AutoAI ) para crear una solución RAG. AutoAI automatiza el flujo de principio a fin, desde la experimentación hasta la implementación. Véase Automatización de un patrón RAG con AutoAI.

Puede omitir la interfaz de usuario y escribir código con REST API, bibliotecas de programación de aplicaciones ( Python ) o SDK de aplicaciones de desarrollo de software ( Node.js ). Visite el Centro de desarrolladores de watsonx.

Más información

Tema principal: Planificación de una solución de IA generativa