Tuning Studio 는 모든 플랜 또는 모든 데이터 센터에서 사용할 수 없습니다. Tuning Studio 에서 튜닝할 수 있는 기초 모델도 데이터 센터에 따라 다를 수 있습니다. 자세한 내용은 watsonx.ai 런타임 플랜 과 서비스 및 기능에 대한 지역별 가용성을 참조하세요.
시작하기 전에
Copy link to section
일반적으로, Tuning Studio 은 watsonx.ai 에 가입할 때 자동으로 생성되는 프로젝트에서 사용할 수 있습니다. 이 프로젝트의 이름은 샌드박스 이고, 기초 모델의 테스트와 커스터마이제이션을 시작하는 데 사용할 수 있습니다.
프로젝트가 없다면 하나 만드십시오. 메인 메뉴에서 프로젝트를 펼친 다음, 모든 프로젝트를 클릭합니다.
이 옵션들은 모델 튜닝을 위한 프롬프트 튜닝 방법과 관련이 있습니다. 각 옵션이 튜닝 실험에 미치는 영향에 대한 자세한 내용은 프롬프트 튜닝 작동 방식을 참고하세요.
텍스트 초기화 방법에만 필요합니다. 프롬프트에 포함하려는 초기화 텍스트를 추가합니다.
분류 작업의 경우, 분류하고자 하는 대상을 설명하고 사용할 분류 라벨을 나열하는 지침을 제공하십시오. 예를 들어, 각 코멘트의 감정이 긍정인지 부정인지 분류합니다.
생성 작업의 경우, 모델이 출력에서 제공하기를 원하는 것을 설명합니다. 예를 들어, 직원들이 일주일에 며칠은 집에서 일할 수 있도록 허용하는 것을 주장하십시오.
요약 작업의 경우, 회의록의 요점을 요약하라는 지시를 내립니다.
작업 유형을 선택하세요.
모델이 수행하기를 원하는 작업과 가장 가까운 작업 유형을 선택하십시오
분류
특징으로부터 범주적 라벨을 예측합니다. 예를 들어, 고객 의견 모음을 제공받은 경우, 각 진술을 질문 또는 문제라고 라벨을 붙이고 싶을 수 있습니다. 고객 문제를 분리하면 문제를 더 빨리 찾아서 해결할 수 있습니다. 이 작업 유형은 단일 라벨 분류를 처리합니다.
세대
텍스트를 생성합니다. 예를 들어, 홍보 이메일을 작성합니다.
요약
텍스트 본문에 표현된 주요 아이디어를 설명하는 텍스트를 생성합니다. 예를 들어, 연구 논문을 요약합니다.
어떤 작업을 선택하든, 입력은 실험 중에 생성 요청 유형으로 기본 기초 모델에 제출됩니다. 분류 작업의 경우, 모델 튜닝에 사용되는 프롬프트에서 클래스 이름이 고려됩니다. 모델과 조정 방법이 발전함에 따라 작업이 정확하게 표현될 경우 활용할 수 있는 작업별 개선 사항이 추가될 가능성이 높습니다.
분류 작업에만 필요 : 분류 출력 필드 에 모델이 사용할 클래스 라벨을 하나씩 추가합니다.
중요 : 훈련 데이터에 사용된 것과 동일한 라벨을 지정하십시오.
조정 실험을 하는 동안, 훈련 데이터의 입력 예제와 함께 클래스 라벨 정보가 제출됩니다.
모델을 조정하는 데 사용할 훈련 데이터를 추가합니다. 파일을 업로드하거나 프로젝트의 자산을 사용할 수 있습니다.
파일 포맷의 예를 보려면, 데이터의 형식은 어떻게 되어야 하는가?를 확장하세요 그런 다음 템플릿 미리보기를 클릭합니다. 데이터 템플릿 중 하나를 복사하거나 다운로드하여 자신의 데이터로 채울 수 있습니다.
선택 사항 : 교육 중에 사용되는 입력 또는 출력 예제의 크기를 제한하려면 허용되는 토큰의 최대 개수를 조정하십시오.
확장 데이터는 어떤 모습이어야 할까요? 스크롤을 내리면 최대 입력 토큰 과 최대 출력 토큰 필드가 표시됩니다. 슬라이더를 드래그하여 값을 변경하십시오. 크기를 제한하면 튜닝 실험을 실행하는 데 걸리는 시간을 줄일 수 있습니다. 자세한 내용은 사용된 토큰 수 제어하기를 참고하세요.
선택 사항 : 매개변수 설정을 클릭하여 튜닝 실험에 사용되는 매개변수를 편집합니다.
튜닝 실행은 모델 튜닝을 위한 좋은 시작점을 나타내는 매개변수 값으로 구성됩니다. 원하는 경우 조정할 수 있습니다.
튜닝 실험이 시작됩니다. 훈련 데이터의 크기와 컴퓨팅 자원의 가용성에 따라 몇 분에서 몇 시간이 걸릴 수 있습니다. 실험이 끝나면 상태가 완료로 표시됩니다.
완료된 튜닝 실험에서 배포를 생성할 때까지 조정된 모델 자산이 생성되지 않습니다. 더 자세한 정보는 튜닝된 모델 배포하기를 참고하세요.
사용된 토큰 수 제어
Copy link to section
자연어 모델의 경우, 단어가 토큰으로 변환됩니다. 256 토큰은 약 130-170 단어에 해당합니다. 128 토큰은 약 65-85 단어에 해당합니다. 그러나 토큰 수는 추정하기 어렵고 모델에 따라 다를 수 있습니다. 자세한 내용은 토큰과 토큰화를 참고하세요.
프롬프트 조정 실험을 하는 동안 모델의 입력과 출력에서 허용되는 토큰의 수를 변경할 수 있습니다.
표 1: 토큰 번호 매개변수
매개변수 이름
기본값
값 옵션
flan-t5-xl-3b 의 가치 옵션만
최대 입력 토큰
256
1-1024
1-256
최대 출력 토큰
128
1-512
1-128
허용되는 입력 및 출력 토큰의 수가 많을수록 모델 튜닝에 더 많은 시간이 걸립니다. 사용 사례에 적절하게 표현하면서도 가능한 한 적은 수의 토큰을 예제에 사용하십시오.
이미 입력 크기를 어느 정도 조절할 수 있습니다. 튜닝 실험에 사용되는 입력 텍스트는 학습 데이터에서 가져옵니다. 따라서, 예제 입력의 길이를 일정하게 유지함으로써 입력 크기를 관리할 수 있습니다. 그러나 다른 팀이나 프로세스에서 선별되지 않은 교육 데이터를 받을 수도 있습니다. 이 경우, 최대 입력 토큰 슬라이더를 사용하여 입력 크기를 관리할 수 있습니다. 파라미터를 200으로 설정하고 훈련 데이터에 1,000개의 토큰이 있는 예제 입력이 있는 경우, 예를 들어 예제가 잘립니다. 예제 입력의 처음 200 토큰만 사용됩니다.
최대 출력 토큰 값 은 훈련 시간에 모델이 출력으로 생성할 수 있는 토큰의 수를 제어하기 때문에 중요합니다. 슬라이더를 사용하여 출력 크기를 제한할 수 있습니다. 이 기능은 모델이 간결한 출력을 생성하는 데 도움이 됩니다.
팁 : 분류 작업의 경우, 출력 크기를 최소화하는 것이 생성 모델이 출력에 분류 패턴을 반복하지 않고 클래스 라벨만 반환하도록 하는 좋은 방법입니다.
튜닝 실험 평가
Copy link to section
실험이 끝나면 시간 경과에 따른 모델 결과의 개선을 보여주는 손실 함수 그래프가 표시됩니다. X축에는 에포크가 표시되고, y축에는 에포크당 예측 결과와 실제 결과의 차이를 측정하는 지표가 표시됩니다. 에포크별로 표시되는 값은 에포크의 모든 누적 단계에서 평균 기울기 값을 계산하여 산출됩니다.