0 / 0
Torna alla versione inglese della documentazione

Dettagli del modello RAG AutoAI

Ultimo aggiornamento: 14 mar 2025
Dettagli del modello RAG AutoAI

Al termine dell'esperimento AutoAI RAG, visualizzare i dettagli di un modello per comprenderne la composizione e le prestazioni.

Panoramica dei modelli

Dalla classifica della pipeline, è possibile visualizzare una tabella con le seguenti informazioni per ciascuno dei modelli generati dall'esperimento:

Colonna Descrizione
Classificazione Classifica dei posizionamenti in base alle migliori prestazioni per la metrica ottimizzata
Nome Nome modello
Nome modello Nome del modello di incorporamento utilizzato per vettorializzare e indicizzare i documenti
Ottimizza metrica Risultato delle prestazioni per la metrica ottimizzata selezionata per l'esperimento. Un modello RAG può essere ottimizzato per la fedeltà della risposta e la correttezza della risposta
Dimensione del blocco Quantità di dati recuperati dai documenti indicizzati
Metodo di richiamo Metodo (Finestra o Semplice) utilizzato per recuperare i documenti indicizzati
Metrica di distanza dell'archivio vettori Metrica (coseno o euclidea) utilizzata per misurare la pertinenza dei vettori memorizzati rispetto ai vettori di ingresso

Dettagli del pattern

Fare clic sul nome di un modello per esaminarne i dettagli di configurazione. Per confrontare due modelli, attiva Confronta modelli e seleziona un modello da confrontare. Alcune impostazioni di configurazione sono modificabili al momento della creazione dell'esperimento. Per i dettagli, vedere Personalizzazione delle impostazioni dell'esperimento RAG.

Informazioni sul pattern

Colonna Descrizione
Modello Nome modello
Tipo di punteggio Come viene calcolata e presentata la metrica delle prestazioni.
- Media: il punteggio medio della metrica.
- IC alto: il limite superiore dell'intervallo di confidenza (IC) per il punteggio medio, che mostra il valore più alto che la metrica può raggiungere.
- IC basso: il limite inferiore dell'intervallo di confidenza (IC) per il punteggio medio, che mostra il valore più basso che la metrica può raggiungere.
Correttezza della risposta Correttezza della risposta generata, che comprende sia la rilevanza del contesto richiamato che la qualità della risposta generata.
Fedeltà della risposta Accuratezza della risposta generata rispetto al testo richiamato.
Correttezza del contesto Pertinenza della risposta generata rispetto all'input.

Archivio vettoriale

Colonna Descrizione
Tipo di origine dati dell'archivio vettori Origine dati che si connette all'archivio vettori.
Metrica di distanza dell'archivio vettori Metrica utilizzata per misurare la pertinenza dei vettori archiviati rispetto al vettore di input.
Nome dell'indice dell'archivio vettori Indice utilizzato come struttura dati per l'archiviazione e il richiamo degli archivi vettori.
Operazione di memorizzazione del vettore Operazione di memorizzazione vettoriale per il recupero dei dati. Ad esempio, upsert per inserire o aggiornare righe nella tabella del database.
Campi dello schema di memorizzazione del vettore Schema per la memorizzazione dell'indice dei documenti vettoriali.
ID schema del negozio vettoriale Identificatore univoco dello schema di memorizzazione vettoriale.
Nome schema di memorizzazione del vettore Nome dello schema utilizzato per strutturare la tabella del database
Tipo di schema di memorizzazione del vettore Determina il tipo di dati che possono essere memorizzati nello schema e le operazioni che possono essere eseguite sui dati. Il tipo di schema struct viene utilizzato per memorizzare dati strutturati.

Suddivisione in blocchi

Colonna Descrizione
Sovrapposizione dei blocchi Numero di blocchi che condividono parole o frasi comuni.
Dimensione del blocco Quantità di dati richiamati dai documenti dell'indice.
Aumento dei blocchi Come viene richiamato il testo pertinente per ogni blocco dell'input dopo la suddivisione dell'input in più blocchi.

Integrazioni

Colonna Descrizione
Modello di integrazione Modello di integrazione utilizzato per vettorializzare e indicizzare la raccolta di documenti.
Tronca token di input Numero massimo di token accettati come input.
Strategia di troncamento Strategia utilizzata per determinare come elaborare i documenti richiamati per ottimizzare le prestazioni del modello.

Richiamo

Colonna Descrizione
Metodo di richiamo Metodo utilizzato per richiamare i documenti indicizzati: finestra o semplice.
Numero di blocchi Numero di blocchi richiamato dai documenti indicizzati.
Dimensione finestra Numero di token adiacenti considerato dal modello durante il richiamo del testo dai documenti indicizzati.

Generazione

Colonna Descrizione
Testo del template di contesto Template strutturato per la risposta generata.
Modello di base Modello di base utilizzato nell'esperimento. Fare clic sull'icona di anteprima per visualizzare i dettagli del modello.
Metodo di decodifica Processo che un modello utilizza per scegliere i token nell'output generato.
Numero massimo di nuovi token Numero massimo di nuovi token che può essere generato in aggiunta ai token richiamati dai documenti indicizzati.
Numero minimo di nuovi token Numero minimo di nuovi token che possono essere generati.
Testo del template di prompt Struttura con linee guida per il modello da utilizzare durante il richiamo del testo dai documenti indicizzati.
Rapporto tra parole e token Numero di parole in un testo diviso per il numero di token generati.

Domande e risposte di esempio

Colonna Descrizione
Domande e risposte di esempio Le domande e le risposte corrette sono fornite come dati di prova per misurare le prestazioni del modello.
Esempio:
Esempi di domande e risposte nei dettagli del modello

Argomento principale: Automatizzazione di un modello RAG con AutoAI