모델을 튜닝하면 기본 모델을 사용하여 목표를 달성하는 데 도움이 될 수 있는 시기를 찾을 수 있습니다.
다음을 수행하려는 경우 기본 모델을 조정하십시오.
규모에 따른 추론 비용 절감
더 큰 기본 모델은 일반적으로 더 나은 결과를 생성합니다. 그러나 사용하는 데에도 비용이 더 많이 듭니다. 모델을 튜닝하면 사용 비용이 적게 드는 작은 모델에서 유사하고 때로는 더 나은 결과를 얻을 수 있습니다.
특정 스타일 또는 형식을 사용하도록 모델의 출력 가져오기
모델에 특수화된 태스크를 지정하여 모델의 성능을 향상시킵니다.
제로샷 (zero-shot) 프롬프트에 대한 응답으로 신뢰할 수 있는 양식으로 출력 생성
기초 모델을 언제, 왜 조정해야 하는지 설명하는 동영상을 시청하세요.
이 비디오는 이 문서에서 다루는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.
모델을 튜닝하지 않는 경우
Copy link to section
모델 튜닝이 항상 모델의 출력을 개선하기 위한 올바른 접근 방식은 아닙니다. 예를 들어, 모델을 튜닝하면 다음을 수행하는 데 도움이 될 수 없습니다.
모델 출력에서 응답의 정확도 향상
질문에 응답하는 시나리오에서 사실적인 기억을 위한 기초 모델을 사용하는 경우 튜닝하면 응답 정확도가 약간 향상됩니다. 실제 응답을 얻으려면 모델에 대한 입력의 일부로 실제 정보를 제공해야 합니다. 튜닝을 사용하면 생성된 실제 응답이 워크플로우의 다운스트림 프로세스에서 더 쉽게 사용할 수 있는 형식을 준수하는 데 도움이 될 수 있습니다. 실제 응답을 리턴하는 방법에 대해 학습하려면 Retreival-augmented generation을 참조하십시오.
출력에서 일관되게 특정 어휘를 사용하도록 모델 가져오기
대량의 데이터에 대해 훈련된 대형 언어 모델은 초기 데이터 세트를 기반으로 어휘를 공식화합니다. 모델을 튜닝하는 데 사용하는 훈련 데이터에서 모델에 중요한 용어를 도입할 수 있습니다. 그러나 모델은 출력에서 이러한 선호 용어를 신뢰할 수 있게 사용하지 않을 수 있습니다.
완전히 새로운 태스크를 수행하도록 기초 모델 교육
신속한 엔지니어링으로 실험하는 것은 기초 모델이 생성할 수 있고 생성할 수 없는 출력 유형을 이해하는 데 도움이 되므로 중요한 첫 번째 단계입니다. 튜닝을 사용하여 기본 모델이 리턴할 수 있는 출력을 조정, 조정 및 쉐이핑할 수 있습니다.
본 사이트의 쿠키 정보웹 사이트가 제대로 작동하려면 일부 쿠키가 필요합니다(필수사항). 또한 다른 쿠키는 사이트 사용을 분석하고 사용자 경험을 개선하며 광고를 목적으로 귀하의 동의에 따라 사용될 수 있습니다.자세한 정보는 쿠키 환경 설정 옵션을 확인해 주시기 바랍니다. IBM 웹사이트를 방문함으로써 귀하는 IBM의개인정보처리방침에 따라 당사가 정보를 처리하는 것에 동의합니다.원활한 탐색을 제공하기 위해 귀하의 쿠키 환경 설정은 여기에 나열된 IBM 웹 도메인 전체에서 공유됩니다.