영어 버전 문서로 돌아가기
RAG 실험을 위한 벡터 저장소 선택하기
RAG 실험을 위한 벡터 저장소 선택하기
마지막 업데이트 날짜: 2025년 1월 23일
AutoAI, 에서 검색 강화 생성을 실험하기 전에 데이터를 저장하고 검색할 벡터 데이터베이스를 선택해야 합니다.
AutoAI RAG 실험의 경우 두 가지 벡터 저장소 옵션 중에서 선택할 수 있습니다:
- 인메모리 크로마 데이터베이스
- Milvus 데이터베이스
크로마 벡터 데이터베이스
인메모리 크로마 벡터 스토어는 컴퓨터의 RAM에 데이터를 저장합니다. 벡터화된 문서의 색인은 데이터 쿼리 및 검색이 빠릅니다. 메모리 제약으로 인해 인메모리 데이터베이스는 중소규모 데이터세트용으로 구축되었습니다.
벡터 저장소에 대한 연결을 지정하지 않으면 벡터화된 콘텐츠가 기본 인메모리 크로마 데이터베이스에 저장됩니다. 콘텐츠는 실험 이후에도 지속되지 않으므로 크로마 옵션은 RAG 패턴을 배포하는 데 실행 가능한 제작 방법이 아닙니다.
Milvus 벡터 데이터베이스
Milvus 의 벡터 스토어 데이터베이스는 확장 가능하고 분산된 아키텍처를 가지고 있습니다. 인덱싱을 최적화하고 다양한 인덱싱 알고리즘과 거리 메트릭을 지원하여 데이터 검색에 있어 높은 성능을 제공합니다. 대규모 데이터 세트를 처리하도록 만들어졌으며 Chroma 데이터베이스보다 내구성이 뛰어납니다.
벡터화된 콘텐츠는 향후 패턴을 위해 지속됩니다. 자세한 내용은 Milvus 로 작업하기를 참고하세요.
Milvus 를 코딩된 솔루션으로 사용하는 경우, 명명 규칙과 데이터베이스 스키마에 대한 규칙을 숙지하십시오
- 컬렉션 이름은 이 형식을 사용합니다:
autoai_rag_a0b1c2d3_ymdHMS>
여기서 연도, 월, 일, 시간, 분, 초는 'y-year, m-month, d-day, H-hour, M-minute, S-second'입니다. - Milvus 데이터베이스는 다음 스키마를 사용합니다
필드 | 유형 |
---|---|
document_id | VarChar |
start_index | Int64 |
Sequence_Number | Int64 |
텍스트 | VarChar |
pk | Int64 |
벡터 | FloatVector |
다음 단계
빠른 경로를 따라 RAG 패턴 검색을 자동화하세요
상위 주제: AutoAI RAG 실험 구축하기
주제가 도움이 되었습니까?
0/1000