Scelta di un negozio di vettori per un esperimento RAG
Prima di eseguire un esperimento di generazione aumentata dal recupero in AutoAI,, è necessario scegliere un database vettoriale per memorizzare e recuperare i dati.
Per gli esperimenti AutoAI RAG, è possibile scegliere tra due opzioni di archiviazione vettoriale:
- Database Chroma in memoria
- Database Milvus
Database di vettori cromatici
Un archivio vettoriale Chroma in-memory memorizza i dati nella RAM del computer. L'indice dei documenti vettoriali è veloce per l'interrogazione e il recupero dei dati. A causa dei vincoli di memoria, il database in-memory è costruito per insiemi di dati di piccole e medie dimensioni.
Se non si specifica una connessione a un archivio vettoriale, il contenuto vettoriale viene salvato nel database Chroma predefinito, in memoria. Il contenuto non persiste oltre l'esperimento, quindi l'opzione Chroma non è un metodo di produzione praticabile per distribuire un modello RAG.
Milvus database vettoriale
Un database Milvus vector store ha un'architettura scalabile e distribuita. Offre prestazioni elevate nel recupero dei dati grazie a un'indicizzazione ottimizzata e al supporto di numerosi algoritmi di indicizzazione e metriche di distanza. È progettato per grandi set di dati ed è più durevole di un database Chroma.
Il contenuto vettoriale persiste per i modelli futuri. Per ulteriori informazioni, vedere Lavorare con Milvus.
Se si utilizza Milvus in una soluzione codificata, occorre familiarizzare con le regole delle convenzioni di denominazione e dello schema del database:
- I nomi delle raccolte utilizzano questo formato:
autoai_rag_a0b1c2d3_ymdHMS>
dove y-anno, m-mese, d-giorno, H-ora, M-minuto, S-secondo. - Un database Milvus utilizza questo schema:
Campo | Tipo |
---|---|
documento_id | VarChar |
indice_inizio | Int64 |
Sequence_Number | Int64 |
Testo | VarChar |
pk | Int64 |
vettore | FloatVector |
Passi successivi
Seguire il percorso rapido per automatizzare la ricerca di un modello RAG
Argomento principale: Costruire esperimenti RAG con AutoAI