RAG実験のためのベクターストアの選択
AutoAI, で検索機能付き生成実験を実行する前に、データを保存し検索するためのベクターデータベースを選択する必要がある。
AutoAI RAG実験では、3つのベクターストアのオプションから選択できます:
- インメモリChromaデータベース
- ミルヴァス・データベース
- Elasticsearch
コード化されたソリューションでベクトルストアを使用している場合、コレクション名には次の形式を使用する。 autoai_rag_a0b1c2d3_ymdHMS>
where y-year, m-month, d-day, H-hours, M-minute, S-second.
クロマ・ベクター・データベース
メモリ内のChromaベクターストアは、コンピュータのRAM上にデータを保存します。 ベクトル化された文書のインデックスは、データの検索や取得が高速です。 メモリ制約のため、インメモリデータベースは小規模から中規模のデータセット向けに構築されている。
ベクターストアへの接続を指定しない場合、ベクター化されたコンテンツはデフォルトのインメモリChromaデータベースに保存されます。 そのため、クロマオプションはRAGパターンを展開するための有効な制作方法ではない。
Milvus ベクトルデータベース
Milvus のベクターストアデータベースは、拡張性と分散アーキテクチャを備えています。 最適化された索引付けを行い、多くの索引付けアルゴリズムと距離メトリクスをサポートすることで、データ検索において高いパフォーマンスを発揮する。 大規模なデータセット用に構築されており、Chroma データベースよりも耐久性に優れています。
ベクトル化されたコンテンツは、将来のパターンのために持続する。 詳細は、 Milvus の操作を参照してください。
Milvus データベースは、このスキーマを使用しています
フィールド | タイプ |
---|---|
ドキュメントID | VarChar |
開始インデックス | Int64 |
シーケンス番号 | Int64 |
テキスト | VarChar |
PK | Int64 |
ベクトル | FloatVector |
Elasticsearch ベクトルデータベース
Elasticsearch は、ベクトルストアの検索機能を持つ検索・分析エンジンである。 Milvus と同様、大規模なデータセットのために構築されており、耐久性と拡張性に優れたアーキテクチャを備えている。 Elasticsearch ベクトルデータベースを使用することは、検索エンジンをルーツとする強力な検索・フィルタリング機能を備えているため、複雑なクエリに有益である。
次のステップ
RAGパターンの検索を自動化 するための高速パスに従ってください。
親トピック AutoAIでRAG実験を構築する