0 / 0

RAG 실험을 위한 벡터 저장소 선택하기

마지막 업데이트 날짜: 2025년 6월 09일
RAG 실험을 위한 벡터 저장소 선택하기

AutoAI, 에서 검색 강화 생성을 실험하기 전에 데이터를 저장하고 검색할 벡터 데이터베이스를 선택해야 합니다.

AutoAI RAG 실험의 경우 세 가지 벡터 저장소 옵션 중에서 선택할 수 있습니다:

  • 인메모리 크로마 데이터베이스
  • Milvus 데이터베이스
  • Elasticsearch

코딩된 솔루션에서 벡터 저장소를 사용하는 경우 컬렉션 이름에 다음 형식을 사용합니다: autoai_rag_a0b1c2d3_ymdHMS> 여기서 y년, m-월, d-일, H-시간, M-분, S-초.

크로마 벡터 데이터베이스

인메모리 크로마 벡터 스토어는 컴퓨터의 RAM에 데이터를 저장합니다. 벡터화된 문서의 색인은 데이터 쿼리 및 검색이 빠릅니다. 메모리 제약으로 인해 인메모리 데이터베이스는 중소규모 데이터세트용으로 구축되었습니다.

벡터 저장소에 대한 연결을 지정하지 않으면 벡터화된 콘텐츠가 기본 인메모리 크로마 데이터베이스에 저장됩니다. 콘텐츠는 실험 이후에도 지속되지 않으므로 크로마 옵션은 RAG 패턴을 배포하는 데 실행 가능한 제작 방법이 아닙니다.

Milvus 벡터 데이터베이스

Milvus 의 벡터 스토어 데이터베이스는 확장 가능하고 분산된 아키텍처를 가지고 있습니다. 인덱싱을 최적화하고 다양한 인덱싱 알고리즘과 거리 메트릭을 지원하여 데이터 검색에 있어 높은 성능을 제공합니다. 대규모 데이터 세트를 처리하도록 만들어졌으며 Chroma 데이터베이스보다 내구성이 뛰어납니다.

벡터화된 콘텐츠는 향후 패턴을 위해 지속됩니다. 자세한 내용은 Milvus 로 작업하기를 참고하세요.

Milvus 데이터베이스는 다음 스키마를 사용합니다

필드 유형
document_id VarChar
start_index Int64
Sequence_Number Int64
텍스트 VarChar
pk Int64
벡터 FloatVector

Elasticsearch 벡터 데이터베이스

Elasticsearch 는 벡터 스토어 검색 기능을 갖춘 검색 및 분석 엔진입니다. Milvus 와 마찬가지로 대규모 데이터 세트를 위해 구축되었으며 내구성과 확장성이 뛰어난 아키텍처를 갖추고 있습니다. Elasticsearch 벡터 데이터베이스는 검색 엔진에 뿌리를 두고 있기 때문에 강력한 검색 및 필터링 기능을 갖추고 있어 복잡한 쿼리에 유용합니다.

다음 단계

빠른 경로를 따라 RAG 패턴 검색을 자동화하세요.

상위 주제: AutoAI RAG 실험 구축하기