Patrón de solución para responder preguntas con generación aumentada por recuperación
Última actualización: 07 mar 2025
Patrón de solución para responder preguntas con generación aumentada por recuperación
Puede crear una solución de IA generativa que responda a las preguntas de los usuarios basándose en la información de una base de conocimientos mediante la aplicación del patrón de generación aumentada por recuperación (RAG).
Caso de uso y requisitos
Copy link to section
El patrón RAG es útil cuando se necesita un modelo de base para complementar las respuestas a las preguntas con la información que se proporciona. Por ejemplo, supongamos que desea implementar un chatbot para su nuevo producto que responda preguntas basadas en la documentación de su producto.
Una solución RAG que responda a preguntas basadas en la documentación del producto podría incluir estas tareas:
Encuentre la respuesta a la pregunta del usuario en la documentación del producto.
Generar respuestas basadas en la documentación del producto.
Enlace a los temas de la documentación que proporcionaron la respuesta.
Guarde todas las preguntas y respuestas.
Recopilar comentarios de los usuarios sobre las respuestas.
Entregar los comentarios negativos a los redactores de la documentación.
arquitectura de la solución
Copy link to section
Un patrón RAG suele incluir los siguientes componentes:
Una base de conocimientos que contiene los documentos fuente.
Un modelo de incrustación que convierte el texto de los documentos en incrustaciones vectoriales, que son representaciones numéricas.
Una base de datos vectorial que almacena las incrustaciones vectoriales de sus documentos y el índice vectorial que busca y recupera el contenido.
Una plantilla rápida que combina la pregunta del usuario, el contenido recuperado y las instrucciones para generar una respuesta.
Un modelo de base que genera una respuesta a la pregunta de un usuario basada en el contenido recuperado.
La solución completa también podría incluir los siguientes componentes:
Una aplicación con una interfaz de usuario en la que los usuarios pueden hacer preguntas, recibir respuestas y proporcionar comentarios sobre las respuestas.
Un modelo de reordenación que reordena los resultados recuperados en función de lo bien que responden a la pregunta, en lugar de lo similares que son los resultados a la pregunta.
Un registro de las preguntas, respuestas y comentarios de los usuarios.
Un método para enviar los comentarios a los redactores de la documentación, que pueden actualizarla para que la solución genere mejores respuestas.
Un método para identificar a los mejores expertos para responder a respuestas insatisfactorias.
Por ejemplo, el siguiente gráfico ilustra cómo puede optimizar su solución RAG adaptando su contenido para mejorar las respuestas de IA basadas en los comentarios de los usuarios.
Implementación de la solución
Copy link to section
Para implementar una solución de patrón RAG, siga estos pasos principales:
Configurar una base de datos vectorial.
Crear un índice vectorial.
Especifique el índice del vector en el mensaje.
Evalúe el aviso.
Añadir componentes opcionales.
Implementar el patrón como un servicio de IA.
Llame al punto final del servicio de IA en su aplicación.
Puede poner en marcha su solución RAG con el acelerador de preguntas y respuestas con RAG. El acelerador es un proyecto de muestra que implementa un patrón RAG con un conjunto de cuadernos de notas ( Python ) que puede personalizar para su solución. Ver preguntas y respuestas con el acelerador RAG.
Puede automatizar la búsqueda del mejor patrón RAG, ejecutar la herramienta de optimización de la cadena de suministro ( AutoAI ) para crear una solución RAG. AutoAI automatiza el flujo de principio a fin, desde la experimentación hasta la implementación. Véase Automatización de un patrón RAG con AutoAI.
Puede omitir la interfaz de usuario y escribir código con REST API, bibliotecas de programación de aplicaciones ( Python ) o SDK de aplicaciones de desarrollo de software ( Node.js ). Visite el Centro de desarrolladores de watsonx.