Scelta di un negozio di vettori per un esperimento RAG
Ultimo aggiornamento: 23 gen 2025
Scelta di un negozio di vettori per un esperimento RAG
Prima di eseguire un esperimento di generazione aumentata dal recupero in AutoAI,, è necessario scegliere un database vettoriale per memorizzare e recuperare i dati.
Per gli esperimenti AutoAI RAG, è possibile scegliere tra due opzioni di archiviazione vettoriale:
Database Chroma in memoria
Database Milvus
Database di vettori cromatici
Copy link to section
Un archivio vettoriale Chroma in-memory memorizza i dati nella RAM del computer. L'indice dei documenti vettoriali è veloce per l'interrogazione e il recupero dei dati. A causa dei vincoli di memoria, il database in-memory è costruito per insiemi di dati di piccole e medie dimensioni.
Se non si specifica una connessione a un archivio vettoriale, il contenuto vettoriale viene salvato nel database Chroma predefinito, in memoria. Il contenuto non persiste oltre l'esperimento, quindi l'opzione Chroma non è un metodo di produzione praticabile per distribuire un modello RAG.
Milvus database vettoriale
Copy link to section
Un database Milvus vector store ha un'architettura scalabile e distribuita. Offre prestazioni elevate nel recupero dei dati grazie a un'indicizzazione ottimizzata e al supporto di numerosi algoritmi di indicizzazione e metriche di distanza. È progettato per grandi set di dati ed è più durevole di un database Chroma.
Il contenuto vettoriale persiste per i modelli futuri. Per ulteriori informazioni, vedere Lavorare con Milvus.
Se si utilizza Milvus in una soluzione codificata, occorre familiarizzare con le regole delle convenzioni di denominazione e dello schema del database:
I nomi delle raccolte utilizzano questo formato: autoai_rag_a0b1c2d3_ymdHMS> dove y-anno, m-mese, d-giorno, H-ora, M-minuto, S-secondo.