기초 모델 조정 시기
모델을 튜닝하면 기본 모델을 사용하여 목표를 달성하는 데 도움이 될 수 있는 시기를 찾을 수 있습니다.
다음을 수행하려는 경우 기본 모델을 조정하십시오.
규모에 따른 추론 비용 절감
더 큰 기본 모델은 일반적으로 더 나은 결과를 생성합니다. 그러나 사용하는 데에도 비용이 더 많이 듭니다. 모델을 튜닝하면 사용 비용이 적게 드는 작은 모델에서 유사하고 때로는 더 나은 결과를 얻을 수 있습니다.
특정 스타일 또는 형식을 사용하도록 모델의 출력 가져오기
모델에 특수화된 태스크를 지정하여 모델의 성능을 향상시킵니다.
제로샷 (zero-shot) 프롬프트에 대한 응답으로 신뢰할 수 있는 양식으로 출력 생성
기초 모델을 언제, 왜 조정해야 하는지 설명하는 동영상을 시청하세요.
이 비디오는 이 문서에서 다루는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.
모델을 튜닝하지 않는 경우
모델 튜닝이 항상 모델의 출력을 개선하기 위한 올바른 접근 방식은 아닙니다. 예를 들어, 모델을 튜닝하면 다음을 수행하는 데 도움이 될 수 없습니다.
모델 출력에서 응답의 정확도 향상
질문에 응답하는 시나리오에서 사실적인 기억을 위한 기초 모델을 사용하는 경우 튜닝하면 응답 정확도가 약간 향상됩니다. 실제 응답을 얻으려면 모델에 대한 입력의 일부로 실제 정보를 제공해야 합니다. 튜닝을 사용하면 생성된 실제 응답이 워크플로우의 다운스트림 프로세스에서 더 쉽게 사용할 수 있는 형식을 준수하는 데 도움이 될 수 있습니다. 실제 응답을 리턴하는 방법에 대해 학습하려면 Retreival-augmented generation을 참조하십시오.
출력에서 일관되게 특정 어휘를 사용하도록 모델 가져오기
대량의 데이터에 대해 훈련된 대형 언어 모델은 초기 데이터 세트를 기반으로 어휘를 공식화합니다. 모델을 튜닝하는 데 사용하는 훈련 데이터에서 모델에 중요한 용어를 도입할 수 있습니다. 그러나 모델은 출력에서 이러한 선호 용어를 신뢰할 수 있게 사용하지 않을 수 있습니다.
완전히 새로운 태스크를 수행하도록 기초 모델 교육
신속한 엔지니어링으로 실험하는 것은 기초 모델이 생성할 수 있고 생성할 수 없는 출력 유형을 이해하는 데 도움이 되므로 중요한 첫 번째 단계입니다. 튜닝을 사용하여 기본 모델이 리턴할 수 있는 출력을 조정, 조정 및 쉐이핑할 수 있습니다.
자세히 알아보기
상위 주제: 기초 모델 조정