Tuning Studio

最終更新: 2025年3月04日
Tuning Studio

Tune a foundation model with the Tuning Studio to customize the model for your needs.

必要な権限

チューニング実験を実行するには、プロジェクトで管理者または編集者のロールを持つ必要があります。

Tuning Studio は、すべてのプランまたはすべてのデータ センターで利用できるわけではありません。 watsonx.aiランタイムプランと 'サービスや機能の地域的な利用可能性 を参照。

必要な資格

タスク認証

データ・フォーマット

表形式:JSON、JSONL

注意: 1つ以上のチューニング実験で同じトレーニングデータを使用することができます。
データ・サイズ
50から10,000の入出力例ペア。 最大ファイルサイズは200MBです。

Tuning Studio は、すべてのプランまたはすべてのデータ センターで利用できるわけではありません。 The foundation models that are available for tuning in the Tuning Studio can also differ by data center. 詳細については、 watsonx.ai ランタイム プランサービスおよび機能の地域別の可用性を参照してください。

開始前に

通常、 Tuning Studio は、 watsonx.ai に登録すると自動的に作成されるプロジェクトから利用できます。 The project is named サンドボックス and you can use it to get started with testing and customizing foundation models.

プロジェクトがない場合は、作成してください。 メインメニューから 「プロジェクト」 を展開し、「すべてのプロジェクト」 をクリックします。

  1. 新規プロジェクトをクリックしてください。

  2. プロジェクト名を入力し、必要に応じて説明を追加します。

    レポートやログなどのプロジェクトオプションの詳細については、「プロジェクトの作成」 を参照してください。

  3. 「作成」 をクリックします。

以下のチューニングオプションについて決定する

  • お客様のユースケースに最適な基盤モデルをお選びください。 チューニングする基盤モデルを選ぶ を参照してください。
  • プロンプトの設計作業に基づいて、最良の結果を生み出すパターンに従った一連の例となるプロンプトを作成します。 データ形式を参照してください。

基盤モデルを調整する

watsonx.ai トップページ からプロジェクトを選択し、 新しい資産 > ラベル付きデータで基盤モデルを調整する をクリックします。

  1. チューニング実験の名称を記入してください。

  2. オプション :説明とタグを追加します。 自分自身へのリマインダーとして、また、調整されたモデルの目標をコラボレーターに理解してもらうために、説明を追加します。 タグを割り当てることで、後で資産をフィルタリングして、タグに関連付けられた資産のみを表示することができます。

  3. 「作成」 をクリックします。

  4. Click 基盤モデルを選択 to choose the foundation model that you want to tune.

    タイルをクリックすると、 基盤モデルの詳細が記載されたモデルカードが表示されます。 When you find the foundation model that you want to use, click 選択.

    詳細については、 チューニングする基盤モデルを選ぶ をご覧ください。

  5. プロンプトの初期化方法を選択します。以下のオプションから選択してください

    テキスト
    指定したテキストを使用します。
    RANDOM
    チューニング実験の一環として生成された値を使用します。

    これらのオプションは、チューニングモデルの迅速なチューニング方法に関連しています。 各オプションがチューニング実験にどのように影響するかの詳細については、「プロンプトチューニングの仕組み」 を参照してください。

  6. テキスト初期化メソッドのみに必要なもの :プロンプトに含めたい初期化テキストを追加します。

    • 分類タスクの場合は、分類したい対象を説明し、使用するクラスラベルを列挙した指示を与えます。 例えば、 各コメントの感情がポジティブかネガティブかを分類する
    • 生成的なタスクの場合、モデルが出力として提供するものを記述します。 例えば、 従業員が週に数日、自宅で勤務することを認めるよう、その必要性を訴える
    • 要約のタスクの場合は、「会議記録から要点を要約しなさい 」という指示を出します。
  7. タスクの種類を選択します。

    モデルに実行させたい内容に最も近いタスクの種類を選択してください

    分類
    特徴量からカテゴリラベルを予測する。 例えば、顧客からのコメントのセットが与えられた場合、各ステートメントを質問または問題としてラベル付けしたいと思うかもしれません。 顧客の問題を切り分けることで、より迅速にそれらを見つけ、対処することができます。 このタスクタイプは単一ラベル分類を扱います。
    生成
    テキストを生成する。 例えば、販促メールを書く。
    要約
    文章で表現されている主な考えを説明するテキストを生成する。 例えば、研究論文の要約。

    いずれのタスクを選択した場合でも、入力は実験中に生成リクエストタイプとして基盤モデルに送信されます。 分類タスクでは、モデルの調整に使用されるプロンプトにクラス名が考慮されます。 モデルやチューニング方法が進化するにつれ、タスクが正確に表現されていれば活用できる、タスクに特化した機能強化が追加される可能性が高い。

  8. 分類タスクのみに必要なもの分類出力フィールドに、モデルに使用させたいクラスラベルを1つずつ追加します。

    重要 :トレーニングデータで使用されているものと同じラベルを指定してください。

    チューニング実験中、クラスラベル情報は、トレーニングデータからの入力例とともに提出されます。

  9. モデルの調整に使用するトレーニングデータを追加します。 ファイルをアップロードするか、プロジェクトから資産を使用することができます。

    ファイルのフォーマット方法の例を見るには、「データはどのような形式にするべきか?」 を展開します 次に、テンプレートプレビュー をクリックします。 データテンプレートをコピーまたはダウンロードし、ご自身のデータで入力することができます。

    詳細は、データ形式をご覧ください。

  10. オプション :トレーニングに使用される入力または出力のサンプルのサイズを制限したい場合は、許可されるトークンの最大数を調整します。

    展開あなたのデータはどのような形であるべきでしょうか? そして、スクロールして 「最大入力トークン」「最大出力トークン」 のフィールドを確認します。 スライダーをドラッグして値を変更します。 サイズを制限することで、チューニング実験にかかる時間を短縮することができます。 詳細は、「使用するトークンの数を制御する 」を参照してください。

  11. オプション : チューニング実験で使用されるパラメータを編集するには、 [パラメータの構成] をクリックします。

    チューニング実行は、モデルのチューニングの開始点として適したパラメータ値で構成されています。 必要であれば、調整することができます。

    利用可能なパラメータとそれらの機能の詳細については、「パラメータのチューニング」 を参照してください。

    パラメータ値を変更したら、[保存] をクリックします。

  12. チューニングを開始をクリックします。

チューニング実験開始。 トレーニングデータのサイズとコンピューティングリソースの可用性によって、数分から数時間かかる場合があります。 実験が終了すると、ステータスが完了と表示されます。

チューニングされた資産、チューニング実験が完了した後にデプロイメントを作成するまで作成されません。 詳細については、「調整済みのモデルの展開 」を参照してください。

使用するトークンの数を管理する

自然言語モデルでは、単語はトークンに変換されます。 256トークンは、約130~170語に相当します。 128トークンは、約65~85語に相当します。 ただし、トークン数は予測が難しく、機種によって異なる場合があります。 詳細は、「トークンとトークン化 」を参照してください。

モデルの入出力で許容されるトークンの数を、プロンプトチューニング実験中に変更することができます。

表1:トークン番号パラメータ
パラメーター名 デフォルト値 値のオプション flan-t5-xl-3b のみの値引きオプション
最大入力トークン数 256 1~1024 1~256
最大出力トークン数 128 1~512 1~128

許容される入力および出力トークンの数が多ければ多いほど、モデルのチューニングに時間がかかります。 使用例では、使用可能なトークンのうち、ユースケースを適切に表現できる最小限の数を使用してください。

入力サイズはある程度コントロールできています。 チューニング実験で使用される入力テキストは、トレーニングデータから取得されます。 したがって、入力例の長さを一定に保つことで、入力サイズを管理することができます。 しかし、他のチームやプロセスから、未検証のトレーニングデータを受け取っている可能性があります。 その場合は、 入力トークン最大値スライダー を使用して入力サイズを管理することができます。 パラメータを200に設定し、トレーニングデータに1,000トークンを持つ入力例がある場合、例えば、その入力例は切り捨てられます。 例の入力の最初の200トークンだけが使用されます。

Max出力トークン値は重要です。なぜなら、これはトレーニング時にモデルが出力として生成できるトークンの数を制御するからです。 スライダーを使用して出力サイズを制限すると、モデルが簡潔な出力を生成するのに役立ちます。

ヒント: 分類タスクの場合、生成モデルが出力に分類パターンを繰り返さないように、クラスラベルのみを返させるには、出力のサイズを最小化するのが良い方法です。

チューニング実験の評価

実験が終了すると、時間の経過とともにモデル出力が改善していく様子を示す損失関数のグラフが表示されます。 エポックはX軸に示され、予測結果と実際のエポックごとの結果の差異の尺度がY軸に示されています。 エポックごとに表示される値は、そのエポック内のすべての累積ステップの平均勾配値から計算されます。

結果の評価方法についての詳細は、「チューニング実験の結果の評価 」を参照してください。

チューニング実験の結果に満足したら、チューニングした基盤モデルを展開します。 詳細については、「調整済みのモデルの展開 」を参照してください。

再度チューニング実験を行う

チューニング実験を再度実行するには、以下の手順に従ってください

  1. From the project's 資産 page, filter your assets by the チューニング実験 asset type.
  2. Find and open your tuning experiment asset, and then click 新チューニングモデル.

チューニング実験の損失関数を、過去の実行の損失関数と同じグラフに表示して比較できるようにします。

9回の実験結果の損失関数を1つのグラフで表示

チューニングされた基盤モデル 資産に加え、チューニング実験自体も資産保存されます。 以前の実験結果の方が後に行なった実験よりも優れている場合、以前の実験に戻り、その結果の資産を使用して新しい調整済みのデプロイメントを作成することができます。

詳細情報

親トピック: 基盤モデルチューニング