Preguntas y respuestas con RAG Accelerator
Pruebe las preguntas y respuestas con el acelerador RAG para configurar la generación aumentada por recuperación (RAG) y generar resultados fácticamente precisos basados en la información de los documentos proporcionados.
Inicie sesión en el centro de recursos y luego cree el proyecto de muestra de preguntas y respuestas con RAG Accelerator.
Las preguntas y respuestas con el acelerador RAG proporcionan un patrón e implementación avanzados de RAG que incluye los siguientes procesos:
- Procesamiento de documentos : La conversión, procesamiento e indexación de documentos para generar un índice vectorial.
- Generación de respuestas : Respuesta a preguntas mediante generación aumentada de recuperación basada en resultados de búsqueda vectorial.
- Registro de entrada/salida : El registro de preguntas, fragmentos recuperados y metadatos, y respuestas en un índice de registro secundario.
- Recopilación de comentarios de los usuarios: los comentarios de los usuarios se adjuntan a las entradas del registro de entrada/salida correspondientes.
- Análisis de contenido : Un informe del contenido específico que necesita ser mejorado para mejorar las respuestas que recibieron comentarios negativos de los usuarios.
- Intervención humana : La identificación de los mejores expertos para responder a respuestas insatisfactorias mediante el uso de un índice vectorial con perfiles de expertos.
El siguiente gráfico muestra cómo los procesos de preguntas y respuestas con RAG Accelerator son cíclicos, de modo que el contenido del documento se actualiza en función de los comentarios de los usuarios.
Proceso de documentos
Un cuaderno para el procesamiento y la indexación de documentos automatiza la conversión, división e indexación de documentos en un índice vectorial en una de estas bases de datos vectoriales:
- watsonx.data Milvus
- watsonx Discovery con Elastic Search Enterprise o IBM Cloud Databases for Elasticsearch Platinum.
El documento de ejemplo que se debe vectorizar es una versión de esta documentación watsonx as a Service en un archivo ZIP. Puede personalizar el cuaderno para ejecutar índices vectoriales existentes que haya creado fuera de watsonx con otras herramientas, por ejemplo, conectores y canalizaciones Elastic, canalizaciones Spark o sus propios procesos.
Generación de respuestas
El cuaderno para la función Q&A Python define el código de función Python y automatiza su implementación con un sufijo URL bien definido en un espacio de implementación. El código de función Q&A with RAG Python se configura mediante conjuntos de parámetros. La función toma una pregunta como entrada y consulta el índice vectorial para recuperar los fragmentos más relevantes para responder a la pregunta y los metadatos de los fragmentos, incluidos los enlaces a los documentos fuente. La función añade los fragmentos más relevantes a la plantilla de aviso configurada y devuelve la respuesta generada, la puntuación de fidelidad calculada y los fragmentos recuperados con metadatos.
Registro de entradas/salidas
Para cada llamada de la función Q&A with RAG Python, puede habilitar el registro del texto de entrada y salida del mensaje. Cualquier PII se elimina de las cadenas antes de registrarse. El índice de registro es independiente del índice vectorial para los documentos de la base de datos vectorial.
Si el registro de entrada/salida está activo, puede habilitar las sugerencias de finalización de preguntas de escritura anticipada cuando los usuarios escriban sus preguntas. Si el usuario acepta una respuesta basada en una pregunta respondida recientemente, la respuesta se recupera del índice de registro, lo que ahorra tiempo y costes de inferencia y recuperación de la GPU.
Recopilación de comentarios de los usuarios
Los comentarios de los usuarios ayudan a las partes interesadas a comprender en qué medida la solución funciona para sus usuarios, qué temas de los documentos les interesan y en qué medida la solución responde a las preguntas basadas en el contenido. Puede configurar la aplicación para que vuelva a llamar a la función de preguntas y respuestas con el semáforo de colores ( Python ) para recopilar los comentarios de los usuarios sobre la respuesta. La valoración de satisfacción del usuario y un comentario opcional se añaden al registro de preguntas y respuestas para su posterior análisis.
Análisis del contenido
Puede configurar el cuaderno de análisis de comentarios de los usuarios y ejecutarlo directamente o como un trabajo. El cuaderno consulta los datos de registro para el intervalo de tiempo especificado o las fechas de inicio y finalización. El cuaderno carga los datos de registro en un marco de datos y utiliza la detección de temas no supervisada de BERTopic o el procesamiento de lenguaje natural de Watson, para determinar qué temas de documentos se recuperaron con más frecuencia para generar respuestas. El cuaderno analiza y visualiza la satisfacción del usuario por tema, e incluye las preguntas, respuestas y comentarios de los usuarios para las respuestas con baja calificación. Basándose en estos conocimientos, las partes interesadas y los propietarios de los contenidos de conocimiento pueden impulsar mejoras en los contenidos que den lugar a mejores respuestas.
Intervención humana
Cuando un usuario no está satisfecho con una respuesta, puede configurar la aplicación para que busque un contacto experto que pueda proporcionar una respuesta mejor. Puede configurar el cuaderno de perfiles de expertos para procesar documentos de perfiles de expertos y crear un índice basado en esa información. Por ejemplo, la aplicación puede dirigir la pregunta al experto, enviar la respuesta del experto al usuario y alertar al propietario de la base de conocimientos de una posible mejora del contenido.
Más información
Tema principal: Aceleradores de soluciones de IA