Torna alla versione inglese della documentazione
Dettagli del modello RAG AutoAI
Dettagli del modello RAG AutoAI
Ultimo aggiornamento: 14 mar 2025
Al termine dell'esperimento AutoAI RAG, visualizzare i dettagli di un modello per comprenderne la composizione e le prestazioni.
Panoramica dei modelli
Dalla classifica della pipeline, è possibile visualizzare una tabella con le seguenti informazioni per ciascuno dei modelli generati dall'esperimento:
Colonna | Descrizione |
---|---|
Classificazione | Classifica dei posizionamenti in base alle migliori prestazioni per la metrica ottimizzata |
Nome | Nome modello |
Nome modello | Nome del modello di incorporamento utilizzato per vettorializzare e indicizzare i documenti |
Ottimizza metrica | Risultato delle prestazioni per la metrica ottimizzata selezionata per l'esperimento. Un modello RAG può essere ottimizzato per la fedeltà della risposta e la correttezza della risposta |
Dimensione del blocco | Quantità di dati recuperati dai documenti indicizzati |
Metodo di richiamo | Metodo (Finestra o Semplice) utilizzato per recuperare i documenti indicizzati |
Metrica di distanza dell'archivio vettori | Metrica (coseno o euclidea) utilizzata per misurare la pertinenza dei vettori memorizzati rispetto ai vettori di ingresso |
Dettagli del pattern
Fare clic sul nome di un modello per esaminarne i dettagli di configurazione. Per confrontare due modelli, attiva Confronta modelli e seleziona un modello da confrontare. Alcune impostazioni di configurazione sono modificabili al momento della creazione dell'esperimento. Per i dettagli, vedere Personalizzazione delle impostazioni dell'esperimento RAG.
Informazioni sul pattern
Colonna | Descrizione |
---|---|
Modello | Nome modello |
Tipo di punteggio | Come viene calcolata e presentata la metrica delle prestazioni. - Media: il punteggio medio della metrica. - IC alto: il limite superiore dell'intervallo di confidenza (IC) per il punteggio medio, che mostra il valore più alto che la metrica può raggiungere. - IC basso: il limite inferiore dell'intervallo di confidenza (IC) per il punteggio medio, che mostra il valore più basso che la metrica può raggiungere. |
Correttezza della risposta | Correttezza della risposta generata, che comprende sia la rilevanza del contesto richiamato che la qualità della risposta generata. |
Fedeltà della risposta | Accuratezza della risposta generata rispetto al testo richiamato. |
Correttezza del contesto | Pertinenza della risposta generata rispetto all'input. |
Archivio vettoriale
Colonna | Descrizione |
---|---|
Tipo di origine dati dell'archivio vettori | Origine dati che si connette all'archivio vettori. |
Metrica di distanza dell'archivio vettori | Metrica utilizzata per misurare la pertinenza dei vettori archiviati rispetto al vettore di input. |
Nome dell'indice dell'archivio vettori | Indice utilizzato come struttura dati per l'archiviazione e il richiamo degli archivi vettori. |
Operazione di memorizzazione del vettore | Operazione di memorizzazione vettoriale per il recupero dei dati. Ad esempio, upsert per inserire o aggiornare righe nella tabella del database. |
Campi dello schema di memorizzazione del vettore | Schema per la memorizzazione dell'indice dei documenti vettoriali. |
ID schema del negozio vettoriale | Identificatore univoco dello schema di memorizzazione vettoriale. |
Nome schema di memorizzazione del vettore | Nome dello schema utilizzato per strutturare la tabella del database |
Tipo di schema di memorizzazione del vettore | Determina il tipo di dati che possono essere memorizzati nello schema e le operazioni che possono essere eseguite sui dati. Il tipo di schema struct viene utilizzato per memorizzare dati strutturati. |
Suddivisione in blocchi
Colonna | Descrizione |
---|---|
Sovrapposizione dei blocchi | Numero di blocchi che condividono parole o frasi comuni. |
Dimensione del blocco | Quantità di dati richiamati dai documenti dell'indice. |
Aumento dei blocchi | Come viene richiamato il testo pertinente per ogni blocco dell'input dopo la suddivisione dell'input in più blocchi. |
Integrazioni
Colonna | Descrizione |
---|---|
Modello di integrazione | Modello di integrazione utilizzato per vettorializzare e indicizzare la raccolta di documenti. |
Tronca token di input | Numero massimo di token accettati come input. |
Strategia di troncamento | Strategia utilizzata per determinare come elaborare i documenti richiamati per ottimizzare le prestazioni del modello. |
Richiamo
Colonna | Descrizione |
---|---|
Metodo di richiamo | Metodo utilizzato per richiamare i documenti indicizzati: finestra o semplice. |
Numero di blocchi | Numero di blocchi richiamato dai documenti indicizzati. |
Dimensione finestra | Numero di token adiacenti considerato dal modello durante il richiamo del testo dai documenti indicizzati. |
Generazione
Colonna | Descrizione |
---|---|
Testo del template di contesto | Template strutturato per la risposta generata. |
Modello di base | Modello di base utilizzato nell'esperimento. Fare clic sull'icona di anteprima per visualizzare i dettagli del modello. |
Metodo di decodifica | Processo che un modello utilizza per scegliere i token nell'output generato. |
Numero massimo di nuovi token | Numero massimo di nuovi token che può essere generato in aggiunta ai token richiamati dai documenti indicizzati. |
Numero minimo di nuovi token | Numero minimo di nuovi token che possono essere generati. |
Testo del template di prompt | Struttura con linee guida per il modello da utilizzare durante il richiamo del testo dai documenti indicizzati. |
Rapporto tra parole e token | Numero di parole in un testo diviso per il numero di token generati. |
Domande e risposte di esempio
Colonna | Descrizione |
---|---|
Domande e risposte di esempio | Le domande e le risposte corrette sono fornite come dati di prova per misurare le prestazioni del modello. Esempio: ![]() |
Argomento principale: Automatizzazione di un modello RAG con AutoAI
L'argomento è stato utile?
0/1000