0 / 0
Volver a la versión inglesa de la documentación

Detalles del patrón AutoAI RAG

Última actualización: 14 mar 2025
Detalles del patrón AutoAI RAG

Una vez finalizado el experimento de AutoAI RAG, visualice los detalles de un patrón para comprender la composición y el rendimiento.

Descripción general del patrón

Desde la tabla de clasificación del pipeline, puede ver una tabla con la siguiente información para cada uno de los patrones que genera el experimento:

Columna Descripción
Clasificar Clasificación de la colocación según el mejor rendimiento para la métrica optimizada
Nombre Nombre de patrón
Nombre de modelo Nombre del modelo de incrustación utilizado para vectorizar e indexar los documentos
Métrica de optimización Resultado del rendimiento de la métrica optimizada seleccionada para el experimento. Un patrón RAG puede optimizarse para la fidelidad de la respuesta y la corrección de la respuesta
Tamaño del fragmento Cantidad de datos recuperados de los documentos indexados
Método de recuperación Método (Window o Simple) utilizado para recuperar los documentos indexados
Métrica de distancia de almacén de vectores Métrica (coseno o euclídea) utilizada para medir la relación entre los vectores almacenados y los vectores de entrada

Detalles de patrón

Haga clic en un nombre de patrón para revisar los siguientes detalles de configuración de un patrón. Para comparar dos patrones, active Comparar patrones y seleccione un patrón para comparar. Algunos de los parámetros de configuración se pueden editar al crear el experimento. Para más detalles, consulte Personalización de la configuración del experimento RAG.

Información sobre el patrón

Columna Descripción
Patrón Nombre de patrón
Tipo de puntuación Cómo se calcula y presenta la métrica de rendimiento.
- Media: La puntuación media de la métrica.
- IC Alto: El límite superior del intervalo de confianza (IC) para la puntuación media, que muestra el valor más alto que la métrica puede alcanzar.
- IC Bajo: El límite inferior del intervalo de confianza (IC) para la puntuación media, que muestra el valor más bajo que la métrica puede alcanzar.
Exactitud de las respuestas Exactitud de la respuesta generada, incluyendo tanto la relevancia del contexto recuperado como la calidad de la respuesta generada.
Fidelidad de la respuesta Precisión de la respuesta generada respecto al texto recuperado.
Exactitud contextual Relevancia de la respuesta generada con respecto a la entrada.

Almacén de vectores

Columna Descripción
Tipo de origen de datos del almacén vectorial Origen de datos que se conecta al almacén de vectores.
Métrica de distancia de almacén de vectores Métrica utilizada para medir la relevancia de los vectores almacenados con respecto al vector de entrada.
Nombre de índice del almacén vectorial Índice utilizado como estructura de datos para almacenar y recuperar almacenes vectoriales.
Operación de almacén de vectores Operación de almacenamiento vectorial para recuperar datos. Por ejemplo, upsert para insertar o actualizar filas en la tabla de la base de datos.
Campos de esquema de almacén de vectores Esquema para almacenar el índice de documentos vectorizados.
ID del esquema del almacén vectorial Identificador único del esquema de la tienda de vectores.
Nombre del esquema de almacén de vectores Nombre del esquema utilizado para estructurar la tabla de la base de datos
Tipo de esquema de almacén de vectores Determina el tipo de datos que se pueden almacenar en el esquema y las operaciones que se pueden realizar con los datos. El tipo de esquema struct se utiliza para almacenar datos estructurados.

Fragmentación

Columna Descripción
Solapamiento de fragmentos Número de fragmentos que comparten palabras o frases comunes.
Tamaño del fragmento Cantidad de datos recuperados de los documentos de índice.
Aumento de fragmentos Cómo se recupera el texto relevante para cada fragmento de la entrada después de dividir la entrada en varios fragmentos.

Inclusiones

Columna Descripción
Modelo de inclusión Modelo de incrustación utilizado para vectorizar e indexar la colección de documentos.
Truncar las señales de entrada Número máximo de señales aceptadas como entrada.
Estrategia de truncamiento Estrategia utilizada para determinar cómo procesar los documentos recuperados para optimizar el rendimiento del modelo.

Recuperación

Columna Descripción
Método de recuperación Método utilizado para recuperar los documentos indexados: ventana o simple.
Número de fragmentos Número de fragmentos recuperados de los documentos indexados.
Tamaño de ventana Número de señales adyacentes que el modelo tiene en cuenta al recuperar texto de documentos indexados.

Generación

Columna Descripción
Texto de plantilla de contexto Plantilla estructurada para la respuesta generada.
Modelo base Modelo fundacional utilizado en el experimento. Haz clic en el icono de vista previa para ver los detalles del modelo.
Método de decodificación Proceso que utiliza un modelo para elegir los tokens en el resultado generado.
Máximo de nuevos tokens Número máximo de señales nuevas que se pueden generar además de las señales recuperadas de los documentos indexados.
Mínimo de nuevos tokens Número mínimo de nuevos tokens que se pueden generar.
Texto de la plantilla de solicitud Estructura con directrices para el modelo a utilizar cuando se recupera texto de documentos indexados.
Relación entre palabras y tokens Número de palabras en un texto dividido por el número de tokens generados.

Ejemplos de preguntas y respuestas

Columna Descripción
Ejemplos de preguntas y respuestas Preguntas y respuestas correctas proporcionadas como datos de prueba para medir el rendimiento del patrón.
Ejemplo:
Ejemplos de preguntas y respuestas en detalles de patrones

Tema principal: Automatización de un patrón RAG con AutoAI