foundation model 조정하는 데에는 몇 가지 이유가 있습니다. 레이블이 지정된 많은 예제에서 모델을 튜닝하여 프롬프트 엔지니어링과 비교하여 모델 성능을 향상시킬 수 있습니다. 동일한 모델 제품군에서 더 큰 모델과 유사하게 수행하도록 기본 모델을 튜닝하면 더 작은 모델을 배치하여 비용을 줄일 수 있습니다.
필수 서비스
watsonx.ai 스튜디오
watsonx.ai 런타임
기본 워크플로우에는 다음 태스크가 포함됩니다.
프로젝트를 여십시오. 프로젝트는 데이터 작업을 위해 다른 사용자와 협업하는 위치입니다.
프로젝트에 데이터를 추가합니다. 데이터 파일을 업로드하거나 연결을 통해 원격 데이터 소스에서 데이터를 추가할 수 있습니다.
프로젝트에서 튜닝 실험을 작성하십시오. 튜닝 실험은 Tuning Studio 실험 빌더를 사용합니다.
실험 결과 및 조정된 모델을 검토하십시오. 결과에는 손실 함수 차트 및 튜닝된 모델의 세부사항이 포함됩니다.
튜닝된 모델을 배치하고 테스트하십시오. Prompt Lab 에서 모델을 테스트해 보세요.
foundation model 튜닝에 대해 알아보기
Copy link to section
프롬프트 튜닝은 모델에 전달되는 프롬프트의 컨텐츠를 조정합니다. 기본 foundation model 해당 매개 변수는 편집되지 않습니다. 프롬프트 입력만 변경됩니다. Tuning Studio 사용하여 모델을 튜닝하면 AI foundation model 원하는 결과물을 반환하도록 안내합니다.
이 학습을 완료하기 위한 팁 다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.
비디오 사진 사용
Copy link to section
팁: 비디오를 시작한 후 학습서를 스크롤하면 비디오가 그림 모드로 이동합니다. 픽처 인 픽처를 사용하여 최상의 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료할 때 비디오를 따라갈 수 있습니다. 수행할 각 태스크의 시간소인을 클릭하십시오.
다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.
이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.
팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.
태스크 1: 프로젝트 열기
이 작업을 미리 보려면 00:04부터 시작하는 동영상을 시청하세요.
튜닝 실험을 저장할 프로젝트가 필요합니다. 샌드박스 프로젝트를 작성하고 서비스를 연관시키는 방법을 보려면 비디오를 보십시오. 그런 다음 단계에 따라 기존 프로젝트가 있는지 확인하거나 프로젝트를 작성하십시오.
조정된 모델을 Prompt Lab 에서 테스트할 수 있습니다. 조정된 모델을 테스트하려면 다음 단계를 수행하십시오.
watsonx 홈 화면으로 돌아가십시오.
샌드박스 프로젝트가 선택되었는지 확인하십시오.
Prompt Lab 일을 클릭합니다.
조정된 모델을 선택하십시오.
모델 드롭 다운 목록을 클릭하고 모든 기초 모델 보기를 선택하십시오.
granite-13b-instruct-v2 모델을 선택합니다.
모델 선택을 클릭하십시오.
구조화 탭을 클릭합니다.
인스트럭션에 입력합니다:
Summarize customer complaints
Copy to clipboard클립보드에 복사됨
예제 및 테스트 입력을 제공하십시오.
입력 및 출력 예제
출력 예
예제 출력
처음에 제가 캐피털 원을 사용하고 있었던 날짜를 잊었습니다. 이 부채는 그들의 손에 있었고 결코 갚지 않았습니다.
부채 콜렉션, 하위 제품: 신용카드 부채, 발행: 부정적 또는 법적 조치 하위 발행을 취하거나 이를 취할 것이라고 위협함
저는 신분 도용의 희생자이며 이 빚은 저의 것이 아닙니다. 신원 도용 보고서와 법적인 진술서를 참조하십시오.
채권 추심, 하위 제품, 모르겠습니다. 빚을 지지 않은 부채를 회수하기 위한 시도 하위 발행 부채는 ID 도용의 결과입니다.
시도 텍스트 필드에서 다음 프롬프트를 복사하여 붙여넣으십시오.
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.
Copy to clipboard클립보드에 복사됨
생성을 클릭하고 결과를 검토하십시오. 이 출력을 튜닝된 모델의 출력과 비교할 수 있도록 기본 모델의 출력에 주목하세요.
작업 저장 > 다른 이름으로 저장을 클릭하십시오.
프롬프트 템플리트를 선택하십시오.
이름에 Base model prompt클립보드에 복사됨을(를) 입력하십시오.
작업에서요약을 선택합니다.
저장 후 프로젝트에서 보기를 선택하십시오.
저장 을 클릭하십시오.
진행 상황 확인
Copy link to section
다음 이미지는 Prompt Lab 결과를 보여줍니다.
태스크 3: 프로젝트에 데이터 추가
이 작업을 미리 보려면 01:12부터 시작하는 동영상을 시청하세요.
프로젝트에 훈련 데이터를 추가해야 합니다. 자원 허브 페이지에서 고객 불만 데이터 세트를 찾을 수 있습니다. 이 데이터 세트에는 신용 보고서와 관련된 일반적인 고객 불만에 대한 가상 데이터가 포함됩니다. 자원 허브에서 프로젝트로 데이터 세트를 추가하려면 다음 단계를 수행하십시오.
다음 이미지는 프로젝트에 추가된 데이터 자산을 표시합니다. 다음 단계는 튜닝 실험을 작성하는 것입니다.
태스크 4: 프로젝트에서 튜닝 실험 작성
이 작업을 미리 보려면 01:32부터 시작하는 동영상을 시청하세요.
이제 방금 프로젝트에 추가한 데이터 세트를 사용하는 샌드박스 프로젝트에서 튜닝 실험을 작성할 준비가 되었습니다. 튜닝 실험을 작성하려면 다음 단계를 수행하십시오.
watsonx 홈 화면으로 돌아가십시오.
샌드박스 프로젝트가 선택되었는지 확인하십시오.
레이블이 지정된 데이터로 foundation model 조정을 클릭합니다.
이름으로 다음을 입력하십시오.
Summarize customer complaints tuned model
Copy to clipboard클립보드에 복사됨
설명에 대해 다음을 입력하십시오.
Tuning Studio experiment to tune a foundation model to handle customer complaints.
Copy to clipboard클립보드에 복사됨
작성을 클릭하십시오. Tuning Studio 가 표시됩니다.
진행 상황 확인
Copy link to section
다음 이미지는 Tuning Studio에 열려 있는 튜닝 실험을 표시합니다. 이제 튜닝 실험을 구성할 준비가 되었습니다.
태스크 5: 튜닝 실험 구성
이 작업을 미리 보려면 01:47부터 시작하는 동영상을 시청하세요.
Tuning Studio에서 튜닝 실험을 구성할 수 있습니다. 조정할 foundation model 완성되었습니다. 튜닝 실험을 구성하려면 다음 단계를 수행하십시오.
조정할 foundation model 선택하려면 foundation model 선택을 클릭합니다.
granite-13b-instruct-v2 선택합니다.
선택을 클릭하십시오.
프롬프트를 초기화할 메소드에 대해 텍스트 를 선택하십시오. 다음 두 가지 옵션이 있습니다.
텍스트: 지정한 텍스트를 사용합니다.
무작위: 튜닝 실험의 일부로 생성된 값을 사용합니다.
텍스트 필드에 다음을 입력하십시오.
Summarize the complaint provided into one sentence.
Copy to clipboard클립보드에 복사됨
다음 표는 각 태스크 유형에 대한 예제 텍스트를 표시합니다.
제목
태스크 유형
예
분류
각 주석의 감성이 긍정적인지 부정적인지 여부를 분류합니다.
세대
직원들이 집에서 일주일에 며칠 근무할 수 있도록 허용하는 것에 대한 사례를 작성하십시오.
요약
미팅 기록의 주요 사항 요약
모델이 수행할 작업과 가장 근접하게 일치하는 태스크 유형에 대해 요약 을 선택하십시오. 다음과 같은 세 가지 태스크 유형이 있습니다.
요약 은 텍스트 본문으로 표시되는 기본 아이디어를 설명하는 텍스트를 생성합니다.
생성 은 프로모션 이메일과 같은 텍스트를 생성합니다.
분류 는 지형에서 범주형 레이블을 예측합니다. 예를 들어, 고객 설명 세트가 제공되면 각 명령문에 질문 또는 문제점으로 레이블을 지정할 수 있습니다. 분류 태스크를 사용할 때 모델에서 사용할 클래스 레이블을 나열해야 합니다. 튜닝 훈련 데이터에서 사용되는 것과 동일한 레이블을 지정하십시오.
프로젝트에서 훈련 데이터를 선택하십시오.
프로젝트에서 선택을 클릭하십시오.
데이터 자산을 클릭하십시오.
고객 불만 교육 data.json 파일을 선택하십시오.
자산 선택을 클릭하십시오.
튜닝 시작을 클릭하십시오.
진행 상황 확인
Copy link to section
다음 이미지는 구성된 튜닝 실험을 표시합니다. 다음으로 결과를 검토하고 튜닝된 모델을 배치합니다.
태스크 6: 튜닝된 모델을 배치 영역에 배치
이 작업을 미리 보려면 03:17부터 시작하는 동영상을 시청하세요.
실험 실행이 완료되면 튜닝된 모델 및 손실 함수 차트가 표시됩니다. 손실 함수는 각 훈련 실행에서 예측 결과와 실제 결과 사이의 차이를 측정합니다. 손실 함수 차트 및 조정된 모델을 보려면 다음 단계를 수행하십시오.
손실 함수 차트를 검토하십시오. 하향 기울기 곡선은 모델이 예상 출력을 생성하는 데 있어 향상되고 있음을 의미합니다.
차트 아래에서 고객 불만 요약 조정 모델을 클릭하십시오.
모델 세부사항을 스크롤하십시오.
배치를 클릭하십시오.
이름을 입력합니다: Summarize customer complaints tuned model클립보드에 복사됨
디플로이 컨테이너에서 디플로이 공간를 선택합니다.
대상 배치 영역에 대해 기존 배치 영역을 선택하십시오. 기존 배치 영역이 없는 경우 다음 단계를 수행하십시오.
대상 배치 영역에 대해 새 배치 영역 작성을 선택하십시오.
배포 공간 이름에 다음을 입력합니다: Foundation models deployment space클립보드에 복사됨
목록에서 스토리지 서비스를 선택하십시오.
목록에서 프로비저닝된 기계 학습 서비스를 선택하십시오.
작성을 클릭하십시오.
닫기를 클릭하십시오.
대상 배치 영역에 대해 Foundation models deployment space 가 선택되어 있는지 확인하십시오.
작성 후 배치 영역에서 배치 보기 옵션을 선택하십시오.
작성을 클릭하십시오.
배치 페이지에서 고객 불만 튜닝된 모델 요약 배치를 클릭하여 세부사항을 보십시오.
진행 상황 확인
Copy link to section
다음 이미지는 배치 영역의 배치를 표시합니다. 이제 배치된 모델을 테스트할 준비가 되었습니다.
태스크 7: 튜닝된 모델 테스트
이 작업을 미리 보려면 04:04부터 시작하는 동영상을 시청하세요.
조정된 모델을 Prompt Lab 에서 테스트할 수 있습니다. 조정된 모델을 테스트하려면 다음 단계를 수행하십시오.
모델 배치 페이지에서 프롬프트 랩에서 열기를 클릭한 후 샌드박스 프로젝트를 선택하십시오. Prompt Lab 표시됩니다.
조정된 모델을 선택하십시오.
모델 드롭 다운 목록을 클릭하고 모든 기초 모델 보기를 선택하십시오.
고객 불만 조정 모델 요약 모델을 선택하십시오.
모델 선택을 클릭하십시오.
구조화 모드 페이지에서 Instruction을 입력하십시오. Summarize customer complaints클립보드에 복사됨
구조화된 모드 페이지에서 예제 및 테스트 입력을 제공하십시오.
입력 및 출력 예제
출력 예
예제 출력
처음에 제가 캐피털 원을 사용하고 있었던 날짜를 잊었습니다. 이 부채는 그들의 손에 있었고 결코 갚지 않았습니다.
부채 콜렉션, 하위 제품: 신용카드 부채, 발행: 부정적 또는 법적 조치 하위 발행을 취하거나 이를 취할 것이라고 위협함
저는 신분 도용의 희생자이며 이 빚은 저의 것이 아닙니다. 신원 도용 보고서와 법적인 진술서를 참조하십시오.
채권 추심, 하위 제품, 모르겠습니다. 빚을 지지 않은 부채를 회수하기 위한 시도 하위 발행 부채는 ID 도용의 결과입니다.
시도 텍스트 필드에서 다음 프롬프트를 복사하여 붙여넣으십시오.
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.
Copy to clipboard클립보드에 복사됨
생성을 클릭하고 결과를 검토하십시오. 기본 모델의 출력과 튜닝된 모델의 이 출력을 비교합니다.
본 사이트의 쿠키 정보웹 사이트가 제대로 작동하려면 일부 쿠키가 필요합니다(필수사항). 또한 다른 쿠키는 사이트 사용을 분석하고 사용자 경험을 개선하며 광고를 목적으로 귀하의 동의에 따라 사용될 수 있습니다.자세한 정보는 쿠키 환경 설정 옵션을 확인해 주시기 바랍니다. IBM 웹사이트를 방문함으로써 귀하는 IBM의개인정보처리방침에 따라 당사가 정보를 처리하는 것에 동의합니다.원활한 탐색을 제공하기 위해 귀하의 쿠키 환경 설정은 여기에 나열된 IBM 웹 도메인 전체에서 공유됩니다.