프롬프트 튜닝 실험을 변경하여 결과를 개선하세요.
watsonx.ai에서 프롬프트 튜닝 기반 모델에 대한 코드를 포함하는 샘플 Python 노트북 Use watsonx.aito tune IBM granite-13b-instruct-v2 model with Car Rental Company 고객 만족 문서 를 사용할 수 있습니다. 샘플 노트북에는 실험 매개변수를 최적화하고 튜닝된 모델을 추론하기 위한 섹션이 있습니다. 자세한 정보는 Python 노트북을 사용하여 기본 모델 튜닝을 참조하십시오.
튜닝 매개변수 조정
튜닝 실험 실행이 완료되면 손실 함수 그래프가 표시됩니다. 손실 함수는 각 훈련 실행에서 예측 결과와 실제 결과 사이의 차이를 측정합니다. 성공적인 튜닝 실험은 하향 경사 곡선을 갖는 손실 함수를 초래합니다.
여기서 손실 측도는 수렴이라고 합니다. 예측 결과가 훈련 데이터의 결과와 가능한 유사하기 때문에 곡선을 드롭하거나 수렴하고 곡선의 꼬리 끝이 가능한 한 0에 가깝게 도달하도록 하려고 합니다.
실험에 대한 손실 함수가 여러 피크가 있는 산 범위와 유사하거나, 손실이 수렴되지 않거나, 손실이 수렴되지만 0보다 훨씬 높은 숫자로 유지되는 경우 튜닝 매개변수를 조정하십시오.
매개변수 값은 튜닝 스튜디오에서 설정하거나 샘플 노트북을 사용하여 설정할 수 있습니다. 샘플 노트북에는 하이퍼 매개변수 최적화라고도 하는 튜닝 매개변수에 사용할 최상의 값을 찾는 데 도움이 되는 단계가 있습니다. 자세한 정보는 노트북을 사용하여 튜닝 매개변수 값 최적화를 참조하십시오.
다음 표에서는 공통 튜닝 실험 결과를 설명하고 결과를 개선할 수 있는 조치를 나열합니다.
손실 함수 그래프 | 원인 | 시도할 조치 |
---|---|---|
손실 곡선은 평평하고 절대 떨어지지 않습니다. |
튜닝은 결과를 크게 개선하지 않습니다. | 실험이 프롬프트 벡터를 보다 과감하게 조정하도록 학습 비율을 늘리십시오 ( 10x만큼). |
손실 곡선은 떨어지지만 꼬리가 너무 높은 수치에 정착합니다. |
튜닝은 가능한 한 많은 결과를 개선하지 않습니다. | 실험에서 프롬프트 벡터를 더 크게 조정할 수 있도록 학습 비율을 늘리십시오 ( 5x만큼). |
손실 곡선이 떨어졌다가 꾸준히 감소하지만 절대 평준화되지 않습니다. |
모델이 완전히 튜닝되기 전에 훈련이 종료되었습니다. | 모델이 학습할 수 있는 시간을 더 많이 제공하도록 에포크 수를 늘리십시오. |
손실 곡선이 상승했다가 하락하지만 결코 충분히 낮아지지는 않습니다. |
높은 학습 비율로 인해 프롬프트 벡터가 너무 많이 변경되므로 훈련이 불안정합니다. | - 프롬프트 벡터를 더 작게 조정하려면 학습 속도를 (10x만큼) 낮춥니다. |
튜닝 매개변수를 변경하고 튜닝 실험을 다시 실행하는 방법에 대한 자세한 정보는 기본 모델 튜닝을 참조하십시오.
튜닝된 모델 출력에서 데이터 품질 문제점 해결
튜닝된 모델에 제로샷 (zero-shot) 프롬프트를 제출하고 예상하는 출력을 다시 가져올 수 있을 때 모델 튜닝이 완료되었음을 알 수 있습니다.
다음 표에서는 일부 공통 훈련 데이터 품질 문제를 설명하고 이를 해결하기 위해 수행할 수 있는 조치를 나열합니다.
결과 | 원인 | 시도할 조치 |
---|---|---|
튜닝된 모델 출력이 훈련 데이터의 출력 예제 컨텐츠 및 형식과 일치하지 않습니다. | 충분하지 않은 훈련 데이터 예제 | 훈련 데이터 크기를 늘리십시오. |
튜닝된 모델 출력이 불완전합니다. | 튜닝 프로세스가 사용 중이라고 생각되는 예제를 사용하지 않습니다. | 훈련 데이터 입력 및 출력 예제의 길이를 감시하십시오. 허용되는 최대 입력 토큰 수는 256이고 허용되는 최대 출력 토큰 수는 128입니다. 허용되는 최대 길이보다 긴 예제는 잘립니다. |
분류 태스크에서 분류 레이블 누락 | 분류 태스크에 대한 각 클래스 유형의 예제가 충분하지 않습니다. | 모델이 인식할 각 클래스 유형의 추가 예제를 추가하십시오. |
추출 작업에서 텍스트 추출 누락 | 추출 작업에 대한 각 엔티티 유형의 예제가 충분하지 않습니다. | 모델이 인식할 각 엔티티 유형의 추가 예제를 추가하십시오. |
부정확한 클래스 레이블 또는 엔티티 유형 텍스트 추출 | 컨텍스트가 부족하여 올바른 클래스 또는 엔티티 유형을 선택할 수 없습니다. | 각 유형에 대해 동일한 수의 예제를 추가하십시오. 모델이 식별하거나 추출할 클래스 또는 엔티티를 검토하여 서로 구별되는지 확인하십시오. |
부모 주제: 튜닝 실험 결과 평가하기