0 / 0
영어 버전 문서로 돌아가기
foundation model 조정하기
마지막 업데이트 날짜: 2024년 11월 28일
foundation model 조정하기

foundation model 튜닝하려면 foundation model 원하는 형태로 원하는 출력을 반환하도록 안내하는 튜닝 실험을 만듭니다.

요구사항

Tuning Studio는 모든 요금제 또는 모든 데이터 센터에서 사용할 수 있는 것은 아닙니다. 튜닝 스튜디오에서 튜닝할 수 있는 기본 모델도 데이터 센터에 따라 다를 수 있습니다. 자세한 내용은 watsonx.ai 런타임 요금제서비스 및 기능의 지역별 가용성을 참조하세요.

일반적으로 Tuning Studio은 watsonx.ai에 가입할 때 자동으로 생성되는 프로젝트에서 사용할 수 있습니다. 프로젝트의 이름은 샌드박스 이며 이를 사용하여 기본 모델 테스트 및 사용자 정의를 시작할 수 있습니다.

프로젝트가 없는 경우 프로젝트를 작성하십시오. 기본 메뉴에서 프로젝트를 펼친 후 모든 프로젝트를 클릭하십시오.

  1. 새 프로젝트를 클릭하십시오.

  2. 프로젝트의 이름을 지정한 후 선택적으로 설명을 추가하십시오.

    보고 또는 로깅과 같은 프로젝트 옵션에 대한 자세한 정보는 프로젝트 작성을 참조하십시오.

  3. 작성을 클릭하십시오.

시작하기 전에

다음 튜닝 옵션에 대한 결정을 내립니다:

  • 사용 사례에 가장 적합한 foundation model 찾아보세요. 조정할 foundation model 선택하기를 참조하세요.
  • 프롬프트 엔지니어링 작업을 기반으로 최상의 결과를 생성하는 패턴을 따르는 예제 프롬프트 세트를 작성하십시오. 데이터 형식를 참조하세요.

foundation model 조정

watsonx.ai 홈페이지 에서 프로젝트를 선택한 다음, 새 자산 > 레이블이 지정된 데이터로 foundation model 조정을 클릭합니다.

  1. 튜닝 실험의 이름을 지정하십시오.

  2. 선택사항: 설명 및 태그를 추가하십시오. 설명을 사용자 자신에게 리마인더로 추가하고 협업자가 조정된 모델의 목표를 이해하는 데 도움을 주십시오. 태그를 지정하면 나중에 튜닝 자산을 필터링하여 태그와 연관된 자산만 표시할 수 있습니다.

  3. 작성을 클릭하십시오.

  4. foundation model 선택을 클릭하여 조정할 foundation model 선택합니다.

    타일을 클릭하면 foundation model 대한 세부 정보가 포함된 모델 카드를 볼 수 있습니다. 사용하려는 foundation model 찾으면 선택을 클릭합니다.

    자세한 내용은 조정할 foundation model 선택하기를 참조하세요.

  5. 다음 옵션에서 프롬프트를 초기화하는 방법을 선택하십시오.

    텍스트
    사용자가 지정하는 텍스트를 사용합니다.
    무작위
    튜닝 실험의 일부로 생성된 값을 사용합니다.

    이러한 옵션은 모델 튜닝을 위한 프롬프트 튜닝 방법과 관련되어 있습니다. 각 옵션이 튜닝 실험에 미치는 영향에 대한 자세한 정보는 프롬프트 튜닝 작동 방법을 참조하십시오.

  6. 텍스트 초기화 메소드에만 필요: 프롬프트에 포함할 초기화 텍스트를 추가하십시오.

    • 분류 태스크의 경우 분류할 내용을 설명하는 지시사항을 제공하고 사용할 클래스 레이블을 나열하십시오. 예를 들어, 각 주석의 감성이 긍정적인지 또는 부정적인지 여부를 분류하십시오.
    • 생성 태스크의 경우, 모델이 출력에 제공할 내용을 설명하십시오. 예를 들어, 직원이 일주일에 몇 일 동안 집에서 근무할 수 있도록 허용하는 경우입니다.
    • 요약 태스크의 경우, 미팅 기록의 기본 지점 요약과 같은 지시사항을 제공하십시오.
  7. 태스크 유형을 선택하십시오.

    모델이 수행할 작업과 가장 근접하게 일치하는 태스크 유형을 선택하십시오.

    분류
    지형에서 범주형 레이블을 예측합니다. 예를 들어, 고객 설명 세트가 제공되면 각 명령문에 질문 또는 문제점으로 레이블을 지정할 수 있습니다. 고객 문제를 분리하여 보다 신속하게 찾아 해결할 수 있습니다. 이 작업 유형은 단일 레이블 분류를 처리합니다.
    세대
    텍스트를 생성합니다. 예를 들어, 프로모션 이메일을 작성합니다.
    요약
    텍스트 본문으로 표현되는 기본 아이디어를 설명하는 텍스트를 생성합니다. 예를 들어, 연구 논문을 요약합니다.

    어떤 작업을 선택하든, 입력은 실험 중에 생성 요청 유형으로 기본 foundation model 제출됩니다. 분류 태스크의 경우, 클래스 이름은 모델을 튜닝하는 데 사용되는 프롬프트에서 고려됩니다. 모델 및 튜닝 방법이 발전함에 따라 태스크가 정확하게 표시되는 경우 활용할 수 있는 태스크 특정 개선사항이 추가될 수 있습니다.

  8. 분류 작업에만 필요: 분류 출력 필드에 모델에서 사용하려는 클래스 레이블을 한 번에 하나씩 추가합니다.

    중요: 훈련 데이터에서 사용되는 것과 동일한 레이블을 지정하십시오.

    튜닝 실험 중에 훈련 데이터의 입력 예제와 함께 클래스 레이블 정보가 제출됩니다.

  9. 모델을 튜닝하는 데 사용할 훈련 데이터를 추가하십시오. 파일을 업로드하거나 프로젝트에서 자산을 사용할 수 있습니다.

    파일을 형식화하는 방법에 대한 예제를 보려면 데이터는 어떻게 표시되어야 합니까?를 펼치십시오. 그런 다음 템플리트 미리보기를 클릭하십시오. 데이터 템플릿 중 하나를 복사하거나 다운로드하여 나만의 데이터로 채울 수 있습니다.

    자세한 내용은 데이터 형식을 참조하세요.

  10. 선택사항: 훈련 중에 사용되는 입력 또는 출력 예제의 크기를 제한하려면 허용되는 최대 토큰 수를 조정하십시오.

    데이터는 어떻게 표시되어야 합니까?를 펼치십시오. 그런 다음 스크롤하여 최대 입력 토큰최대 출력 토큰 필드를 확인하십시오. 슬라이더를 끌어 값을 변경하십시오. 크기를 제한하면 튜닝 실험을 실행하는 데 걸리는 시간을 줄일 수 있습니다. 자세한 정보는 사용되는 토큰 수 제어를 참조하십시오.

  11. 선택사항: 튜닝 실험에서 사용되는 매개변수를 편집하려면 매개변수 구성 을 클릭하십시오.

    튜닝 실행은 모델 튜닝을 위한 좋은 시작점을 나타내는 매개변수 값으로 구성됩니다. 원하는 경우 조정할 수 있습니다.

    사용 가능한 매개변수 및 수행 작업에 대한 자세한 정보는 매개변수 튜닝을 참조하십시오.

    매개변수 값을 변경한 후 저장을 클릭하십시오.

  12. 튜닝 시작을 클릭하십시오.

튜닝 실험이 시작됩니다. 훈련 데이터의 크기 및 컴퓨팅 리소스의 가용성에 따라 몇 분에서 몇 시간이 걸릴 수 있습니다. 실험이 완료되면 상태가 완료됨으로 표시됩니다.

튜닝된 모델 자산은 완료된 튜닝 실험에서 배치를 작성할 때까지 작성되지 않습니다. 자세한 정보는 조정된 모델 배치를 참조하십시오.

사용되는 토큰 수 제어

자연어 모델의 경우 단어가 토큰으로 변환됩니다. 256개의 토큰은 약 130-170개의 단어와 같습니다. 128개의 토큰은 약 65-85단어와 같습니다. 그러나 토큰 번호는 추정하기 어렵고 모델에 따라 다를 수 있습니다. 자세한 정보는 토큰 및 토큰화를 참조하십시오.

프롬프트 튜닝 실험 중에 모델 입력 및 출력에 허용되는 토큰 수를 변경할 수 있습니다.

표 1: 토큰 번호 매개변수
매개변수 이름 기본값 값 옵션 flan-t5-xl-3b 전용 값 옵션
최대 입력 토큰 256 1-1024 1-256
최대 출력 토큰 128 1-512 1-128

허용되는 입력 및 출력 토큰 수가 많을수록 모델을 튜닝하는 데 더 많은 시간이 소요됩니다. 사용할 수 있지만 여전히 유스 케이스를 올바르게 표시하는 예제에서 가장 적은 수의 토큰을 사용하십시오.

이미 입력 크기를 제어할 수 있습니다. 튜닝 실험 중에 사용되는 입력 텍스트는 훈련 데이터에서 가져옵니다. 따라서 예제 입력을 설정된 길이로 유지하여 입력 크기를 관리할 수 있습니다. 그러나 다른 팀 또는 프로세스에서 교육되지 않은 훈련 데이터를 가져올 수 있습니다. 이 경우 최대 입력 토큰 슬라이더를 사용하여 입력 크기를 관리할 수 있습니다. 매개변수를 200으로 설정하고 훈련 데이터에 1,000개의 토큰이 있는 예제 입력이 있는 경우 예는 잘립니다. 예제 입력의 처음 200개토큰만 사용됩니다.

최대 출력 토큰 값은 모델이 훈련 시 출력으로 생성할 수 있는 토큰 수를 제어하므로 중요합니다. 슬라이더를 사용하여 출력 크기를 제한할 수 있으며, 이는 모델이 간결한 출력을 생성하는 데 도움이 됩니다.

팁: 분류 태스크의 경우 출력의 크기를 최소화하는 것은 출력에서 분류 패턴을 반복하지 않고 생성 모델이 클래스 레이블만 리턴하도록 강제 실행하는 좋은 방법입니다.

튜닝 실험 평가

실험이 완료되면 시간 경과에 따른 모델 출력의 개선을 보여주는 손실 함수 그래프가 표시됩니다. 에포크들은 x-축 상에 도시되고, 에포크 당 예측된 결과들과 실제 결과들 사이의 차이의 측정은 y-축 상에 도시된다. 에포크당 표시되는 값은 에포크에 있는 모든 누적 단계의 평균 기울기 값에서 계산됩니다.

결과를 평가하는 방법에 대한 자세한 정보는 튜닝 실험의 결과 평가를 참조하십시오.

튜닝 실험 결과가 만족스러우면 튜닝된 foundation model 배포합니다. 자세한 정보는 조정된 모델 배치를 참조하십시오.

튜닝 실험 다시 실행

튜닝 실험을 다시 실행하려면 다음 단계를 완료하십시오.

  1. 프로젝트의 자산 페이지에서 튜닝 실험 자산 유형으로 자산을 필터링하십시오.
  2. 튜닝 실험 자산을 찾아 연 다음 튜닝된 새 모델을 클릭하십시오.

튜닝 실험의 손실 함수는 비교할 수 있도록 이전 실행의 손실 함수와 동일한 그래프에 표시됩니다.

9개실험 실행의 데이터가 있는 손실 함수 그래프를 하나의 그래프로 표시합니다.

자세히 알아보기

상위 주제: Tuning Studio

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기