0 / 0

프롬프트 튜닝 실험 만들기

마지막 업데이트 날짜: 2025년 5월 01일
프롬프트 튜닝 실험 만들기

파운데이션 모델을 프롬프트 튜닝하기 위해 실행할 수 있는 프롬프트 튜닝 실험을 만듭니다.

필수 작업 : Tuning Studio

파운데이션 모델에 대한 프롬프트 조정을 계속하려면 다음 단계를 완료하세요:

  1. 다음 옵션 중에서 프롬프트 초기화 방법을 선택합니다:

    텍스트
    지정한 텍스트를 사용합니다.
    무작위
    튜닝 실험의 일부로 생성된 값을 사용합니다.

    이러한 옵션은 모델 튜닝을 위한 프롬프트 튜닝 방법과 관련이 있습니다. 각 옵션이 튜닝 실험에 미치는 영향에 대한 자세한 내용은 프롬프트 튜닝의 작동 방식를 참조하세요.

  2. 텍스트 초기화 방법에만 필요합니다: 프롬프트에 포함할 초기화 텍스트를 추가합니다.

    • 분류 작업의 경우, 분류할 내용을 설명하고 사용할 클래스 레이블을 나열하는 지시를 내립니다. 예를 들어, 각 댓글의 감성이 긍정적인지 부정적인지 분류합니다.
    • 생성 작업의 경우 모델이 출력에 제공하고자 하는 내용을 설명합니다. 예를 들어, 직원에게 일주일에 며칠 재택 근무를 허용하는 사례를 만드세요.
    • 요약 작업의 경우 회의 녹취록의 요점 요약과 같은 지시를 내립니다.
  3. 작업 유형을 선택합니다.

    모델에 수행하려는 작업과 가장 유사한 작업 유형을 선택합니다:

    분류
    기능에서 범주형 레이블을 예측합니다. 예를 들어 일련의 고객 댓글이 있을 때 각 댓글에 질문 또는 문제라는 레이블을 지정할 수 있습니다. 고객 문제를 분리하면 문제를 더 빨리 찾아서 해결할 수 있습니다. 이 작업 유형은 단일 레이블 분류를 처리합니다.
    세대
    텍스트를 생성합니다. 예를 들어 홍보 이메일을 작성합니다.
    요약
    본문에서 표현되는 주요 아이디어를 설명하는 텍스트를 생성합니다. 예를 들어, 연구 논문을 요약합니다.

    어떤 작업을 선택하든 입력은 실험 중에 기본 기반 모델에 생성 요청 유형으로 제출됩니다. 목표에 대해 공유하는 추가 정보는 분류 작업에서 사용되며, 예를 들어 지정한 클래스 이름은 모델을 조정하는 데 사용되는 프롬프트에서 고려됩니다.

  4. 분류 작업에만 필요: 분류 출력 필드에 모델에서 사용하려는 클래스 레이블을 한 번에 하나씩 추가합니다.

    중요: 학습 데이터에 사용된 것과 동일한 레이블을 지정합니다.

    튜닝 실험 중에 학습 데이터의 입력 예시와 함께 클래스 레이블 정보가 제출됩니다.

  5. 선택 사항: 튜닝 실험 중에 학습 샘플을 기초 모델에 제출할 때 학습 샘플의 서식을 변경하려면 예, 편집을 클릭하고 프롬프트에 특별한 서식이 필요합니까? 섹션.

    자세한 내용은 즉시 튜닝을 위한 버벌라이저 편집하기를 참조하세요.

  6. 모델을 조정하는 데 사용할 학습 데이터를 추가합니다. 파일을 업로드하거나 프로젝트의 에셋을 사용할 수 있습니다.

    파일 형식 지정 방법의 예를 보려면 데이터는 어떤 모습이어야 하나요? 를 펼치세요, 를 클릭한 다음 템플릿 미리 보기를 클릭합니다. 자세한 내용은 데이터 형식를 참조하세요.

  7. 선택 사항: 학습 중에 사용되는 예제의 토큰 크기를 변경하려면 데이터는 어떤 모습일까요? 를 펼칩니다 를 클릭하여 조정할 수 있습니다.

    자세한 내용은 프롬프트 튜닝 토큰 한도 설정하기를 참조하세요.

  8. 옵션: 매개변수 구성를 클릭하여 튜닝 실험에 사용되는 매개변수를 편집합니다.

    튜닝 실행은 모델 튜닝을 위한 좋은 시작점을 나타내는 매개변수 값으로 구성됩니다. 원하는 경우 조정할 수 있습니다.

    사용 가능한 파라미터와 그 기능에 대한 자세한 내용은 튜닝 파라미터를 참조하세요.

    매개변수 값을 변경한 후 저장를 클릭합니다.

  9. 튜닝 시작를 클릭합니다.

튜닝 실험이 시작됩니다. 트레이닝 데이터의 크기와 컴퓨팅 리소스의 가용성에 따라 몇 분에서 몇 시간이 걸릴 수 있습니다. 실험이 완료되면 상태가 완료됨으로 표시됩니다.

튜닝된 모델 에셋은 완료된 튜닝 실험에서 배포를 생성할 때까지 생성되지 않습니다. 자세한 내용은 튜닝된 모델 배포하기를 참조하세요.

즉각적인 튜닝을 위한 버벌라이저 편집하기

파운데이션 모델 튜닝에 사용되는 버벌라이저를 편집할 수 있습니다.

프롬프트 튜닝을 위한 버벌라이저의 형식은 다음과 같습니다:

Input: {{input}} Output:

기본 형식은 입력 텍스트 앞에 입력:라는 단어를 추가하고 입력 텍스트 뒤에 출력:를 추가하여 생성된 텍스트를 추가할 기초 모델을 표시합니다.

더 설명적인 접두사 텍스트가 기초 모델이 더 나은 답변을 생성하도록 안내할 수 있다면 언어화기를 사용자 지정할 수 있습니다. 예를 들어 기사를 요약하도록 기초 모델을 조정하려면 다음과 같이 버벌라이저를 변경할 수 있습니다:

Article: {{input}} Summary: 

일반적인 InputOutput 대신 접두사 ArticleSummary를 사용하면 기초 모델에 입력 및 예상 출력에 대한 컨텍스트 정보를 더 많이 제공할 수 있습니다.

채팅 사용 사례용으로 설계된 기초 모델의 경우 기본 버벌라이저의 형식이 더 간단합니다:

{{input}}

버벌라이저를 변경할 때는 다음 가이드라인을 따르세요:

  • 사용자 지정 형식이 파운데이션 모델 출력을 향상시키는지 확인하기 위해 엔지니어링을 통해 확인한 후에만 버벌라이저를 변경하세요.

  • {{input}} 변수를 수정하지 마세요.

    이 변수는 튜닝 실험이 학습 데이터 파일의 input 세그먼트에서 텍스트를 추출하도록 지시합니다.

  • 분류 작업의 경우 지정한 클래스 레이블이 자동으로 기초 모델에 전달됩니다. 사용자 지정 버벌라이저에서 지정할 필요는 없습니다.

    그러나 프롬프트 엔지니어링 결과 분류 중인 정보를 나타내는 접두사를 사용하는 것이 더 나은 출력을 생성하는 것으로 나타난 경우 해당 접두사를 사용하도록 언어화기를 변경할 수 있습니다. 고객 피드백을 분류하려는 작업의 경우 예를 들어 Feedback: {{input}} Class:을 사용할 수 있습니다.

  • 기초 모델을 튜닝하는 데 사용되는 언어화기를 변경하는 경우 나중에 튜닝된 모델을 추론할 때 동일한 접두사를 사용하세요.

    예를 들어 사용자 지정 버벌라이저가 Article: {{input}} Summary: 인 경우 Prompt Lab 에서 자유형 모드에서 조정된 파운데이션 모델을 추론할 때 다음과 같이 프롬프트를 지정합니다:

    Article: IBM watsonx Challenge empowers partners to solve real-world problems with AI. In June, IBM invited ecosystem partners in Europe, the Middle East and Africa to participate in an IBM watsonx Challenge, a hands-on experience designed to bring the watsonx platform capabilities to some of the most important members of the IBM ecosystem.These ecosystem partners, who sell, build or service IBM technologies, enthusiastically embraced the challenge. Participants formed teams and focused on quickly crafting a solution to one of three selected challenges. The challenges included using prompt engineering to analyze customer experience by using IBM® watsonx.ai, automating repetitive manual tasks to improve productivity by using IBM watsonx Orchestrate, and building a generative AI-powered virtual assistant by using IBM watsonx™ Assistant and IBM watsonx™ Discovery. This experience enabled passionate learners to experience exciting new generative AI technologies firsthand and it led to innovation and creativity.
    Summary: 
    

    구조화된 모드에서 시도 섹션의 플레이스홀더 접두사를 변경합니다. 예를 들어 InputArticle으로 변경하고 OutputSummary로 변경합니다.

프롬프트 튜닝 토큰 한도 설정하기

자연어 모델의 경우 단어가 토큰으로 변환됩니다. 256개의 토큰은 약 130~170단어에 해당합니다. 128토큰은 약 65~85단어에 해당합니다. 그러나 토큰 번호는 추정하기 어렵고 모델마다 다를 수 있습니다. 자세한 내용은 토큰과 토큰화를 참조하세요.

프롬프트 튜닝 실험 중에 모델 입력 및 출력에 허용되는 토큰 수를 변경할 수 있습니다.

표 1: 토큰 번호 매개변수
매개변수 이름 기본값 값 옵션 flan-t5-xl-3b 전용 값 옵션
최대 입력 토큰 256 1-1024 1-256
최대 출력 토큰 128 1-512 1-128

허용되는 입력 및 출력 토큰의 수가 많을수록 모델을 조정하는 데 시간이 더 오래 걸립니다. 예시에서 사용 가능한 가장 적은 수의 토큰을 사용하되 사용 사례를 제대로 표현할 수 있는 토큰을 사용하세요.

이미 입력 크기를 어느 정도 제어할 수 있습니다. 튜닝 실험 중에 사용되는 입력 텍스트는 학습 데이터에서 가져옵니다. 따라서 예제 입력을 정해진 길이로 유지하여 입력 크기를 관리할 수 있습니다. 그러나 다른 팀이나 프로세스에서 큐레이션되지 않은 교육 데이터를 가져올 수도 있습니다. 이 경우 최대 입력 토큰 슬라이더를 사용하여 입력 크기를 관리할 수 있습니다. 예를 들어 매개변수를 200으로 설정하고 학습 데이터에 1,000개의 토큰이 입력된 예시가 있는 경우 예시가 잘립니다. 예시 입력의 처음 200개 토큰만 사용됩니다.

최대 출력 토큰 값은 학습 시 모델이 출력으로 생성할 수 있는 토큰의 수를 제어하므로 중요합니다. 슬라이더를 사용하여 출력 크기를 제한할 수 있으므로 모델이 간결한 출력을 생성하는 데 도움이 됩니다.

Tip: 분류 작업의 경우 출력 크기를 최소화하면 생성 모델이 출력에서 분류 패턴을 반복하지 않고 클래스 레이블만 반환하도록 강제하는 좋은 방법이 될 수 있습니다.

자세히 알아보기

상위 주제: Tuning Studio