0 / 0
영어 버전 문서로 돌아가기
컨텍스트 길이 제한을 극복하기 위한 기술
마지막 업데이트 날짜: 2024년 11월 28일
컨텍스트 길이 제한을 극복하기 위한 기술

각 foundation model 입력에 허용되는 토큰의 최대 수와 프롬프트에 대해 생성된 출력을 더한 값인 최대 컨텍스트 길이가 있습니다. foundation model 사용하여 작업을 완료할 때 이 제한에 자주 부딪히는 경우 다음 해결 방법 중 하나를 시도해 보세요.

최대 컨텍스트 길이는 foundation model 따라 4,096~131,072 토큰으로 다양합니다. 특히 검색 증강 생성, 요약 또는 대화형 작업에 foundation model 사용하는 경우 컨텍스트 길이 제한이 문제가 될 수 있습니다.

다음 기술을 사용하면 모델의 컨텍스트 창 제한을 초과하지 않고 작업을 완료하는 데 필요한 컨텍스트를 foundation model 제공할 수 있습니다.

RAG 입력을 사용하여 더 적은 토큰 전송

검색 증강 생성(RAG)은 foundation model 외부 소스의 지식을 보강하여 텍스트를 생성하는 기술입니다. 검색 단계에서 외부 소스의 관련 문서는 사용자 조회에서 식별됩니다. 생성 단계에서는 이러한 문서의 일부가 foundation model 프롬프트에 포함되어 검색된 문서에 근거한 응답을 생성합니다.

너무 많은 접지 정보가 포함된 프롬프트를 보내면 입력이 foundation model 컨텍스트 창 제한을 초과할 수 있습니다. 이 제한사항을 해결하려면 다음 기술 중 일부를 시도하십시오.

RAG에 대한 자세한 정보는 검색 기능 보강 생성 (RAG)을 참조하십시오.

관련성별로 컨텐츠 분류

콘텐츠를 분류하는 데 능숙한 foundation model 사용하여 문서가 프롬프트에 포함되기 전에 먼저 질문에 효과적으로 답변할 수 있는지 여부를 결정하세요.

예를 들어, For each question and sample document, check whether the document contains the information that is required to answer the question. If the sample document appears to contain information that is useful for answering the question, respond 'Yes'. Otherwise, respond 'No'. 와 같은 프롬프트를 사용할 수 있습니다.

최대 토큰 수 매개변수를 1로 설정하면 모델이 예 또는 아니오 응답을 리턴할 가능성이 높습니다.

이 분류 방법을 사용하여 검색으로 검색되는 관련 없는 문서 또는 문장을 찾아 제거하십시오. 그런 다음 foundation model 프롬프트에서 질문과 함께 보낼 관련 콘텐츠를 다시 조합합니다.

긴 문서 요약

긴 문서의 경우 foundation model 사용하여 문서의 섹션을 요약하세요. 그런 다음 전체 문서를 foundation model 공급하는 대신 해당 요약본을 제출할 수 있습니다.

예를 들어, 하나의 긴 미팅 대화 내용에서 유용한 요약을 생성하기 위해 대화 내용을 여러 개의 작은 청크로 나누고 각각을 개별적으로 요약할 수 있습니다. 또는 다른 발표자의 기고를 사용하여 세그먼트를 검색하고 추출할 수 있습니다. 그런 다음 요약을 연결하여 foundation model 제출하는 프롬프트의 컨텍스트로 사용할 수 있습니다.

컨텐츠에서 텍스트 임베드 생성

텍스트 임베딩은 실제 값 숫자의 벡터인 정보 단위 (예: 단어 또는 문장) 의 숫자 표시입니다.

RAG 유스 케이스에서 텍스트 임베드를 활용하려면 다음 단계를 완료하십시오.

  1. 텍스트 분할기를 사용하여 컨텐츠를 의미 있는 세그먼트로 분할하십시오.

    예를 들어 재귀 문자 분할기를 사용하여 문서를 foundation model 설정한 구문 및 글자 수 제한 요구 사항을 충족하는 세그먼트로 분할할 수 있습니다. ' LangChain: Recursively split by character 참조.

  2. 임베드 모델을 사용하여 문서 청크를 문서 세그먼트의 의미를 캡처하는 벡터로 변환하십시오.

  3. 문서 세그먼트를 나타내는 벡터를 벡터 데이터베이스에 저장하십시오.

  4. 런타임에 키워드 또는 검색 쿼리를 사용하여 벡터 저장소를 검색하여 foundation model 공급할 가장 관련성이 높은 문서 세그먼트를 검색합니다.

텍스트를 임베딩으로 변환하면 모델이 사실에 입각한 답변을 제공하는 데 도움이 되는 근거 정보를 제거하지 않고 foundation model 프롬프트의 크기를 줄일 수 있습니다.

텍스트 변환을 위해 IBM 임베드 모델을 사용하는 방법에 대한 자세한 정보는 검색 기능이 보강된 생성 태스크에서 벡터화된 텍스트 사용을 참조하십시오.

복잡한 작업의 분할 및 정복

서로 다른 유형의 입력이 예상되고 서로 다른 방식으로 처리해야 하는 복잡한 유스 케이스의 경우 다중 프롬프트 방식을 적용하십시오.

  1. 여러 개의 대상 프롬프트를 작성하십시오. 각 프롬프트는 하나의 입력 유형으로 최적의 효과를 발휘하도록 설계되었습니다.

    예를 들어, 고객 질문을 지원 문제, 영업 조회 또는 제품 세부사항 조회 유형으로 분류할 수 있습니다.

  2. foundation model 사용하여 들어오는 입력을 미리 정의된 입력 유형 중 하나로 분류합니다.

  3. 입력 유형에 따라 적절한 대상 프롬프트로 입력을 경로 지정하십시오.

    예를 들어, 제품 세부사항 조회의 경우 웹 사이트 또는 기타 마케팅 컨텐츠를 검색하고 프롬프트에 요약을 포함할 수 있습니다. 지원 문제의 경우, 문제점 해결 지식 기반을 검색하고 프롬프트에 임시 해결책 프로시저를 포함시킬 수 있습니다. 판매 문의의 경우 고객을 판매자와 연결할 수 있습니다.

대화 상자 컨텍스트 요약

대화 작업의 경우, 각 입력에 대해 채팅 기록을 유지하고 다시 제출하는 대신 foundation model 사용하여 이전 대화 교환의 컨텍스트를 요약하세요. 요약을 사용하면 대화에서 후속 턴에 foundation model 제출되는 토큰의 수가 줄어듭니다.

모델을 프롬프트 조정하여 프롬프트 토큰 수를 줄이십시오.

foundation model 조정하여 프롬프트에 포함하는 복잡한 지침과 예제에서 사용할 수 있는 토큰을 확보하세요.

foundation model 조정할 때 제출하는 입력 유형에 대해 모델에 출력으로 반환할 내용을 표시합니다. 튜닝된 모델에 제로샷 (zero-shot) 프롬프트를 제출하고 예상하는 출력을 계속 가져올 수 있습니다.

모델 튜닝은 분류, 요약 또는 추출 태스크에 유용합니다. 사실 정보를 포함하기 위해 foundation model 출력이 필요한 경우 튜닝은 사용하기에 가장 적합한 솔루션이 아닙니다.

자세한 내용은 foundation model 조정하기를 참조하세요.

자세히 알아보기

상위 주제: 프롬프트 팁

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기