クイックスタートfoundation modelを調整する
foundation modelを調整する理由はいくつかある。 多くのラベル付けされた例でモデルをチューニングすることで、プロンプト・エンジニアリングだけよりもモデルのパフォーマンスを向上させることができます。 同じモデルファミリーのより大きなモデルと同様のパフォーマンスを発揮するようにベースモデルをチューニングすることで、より小さなモデルを配備することでコストを削減することができます。
- 必須のサービス
- Watson Studio
- Watson Machine Learning
基本的なワークフローには、以下のタスクが含まれます:
- プロジェクトを開きます。 プロジェクトは、データを処理するために他のユーザーと共同作業できる場所です。
- データをプロジェクトに追加します。 データファイルをアップロードしたり、接続を通じてリモートデータソースからデータを追加することができます。
- プロジェクトにチューニング実験を作成する。 チューニング実験はTuning Studio実験ビルダーを使います。
- 実験結果と調整されたモデルを見直す。 結果には、損失関数図とチューニングされたモデルの詳細が含まれる。
- 調整したモデルを展開し、テストする。 プロンプト・ラボであなたのモデルをテストしてください。
foundation modelのチューニングについて読む
プロンプトのチューニングは、モデルに渡されるプロンプトの内容を調整する。 基礎となるfoundation modelモデルとそのパラメーターは編集されない。 プロンプトの入力だけが変更される。 Tuning Studioてモデルをチューニングし、AIfoundation modelが望む出力を返すように導きます。
このビデオでは、foundation modelをチューニングするタイミングとその理由をご紹介します。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
foundation modelのチューニングに関するビデオを見る
このチュートリアルのステップをプレビューするには、このビデオをご覧ください。 ビデオで紹介されているユーザーインターフェースには若干の違いがあるかもしれません。 このビデオは、書面でのチュートリアルに付随するものです。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
foundation modelを調整するチュートリアルを試す
このチュートリアルでは、以下のタスクを実行します:
- タスク 1:プロジェクトを開く
- タスク2:ベースモデルのテスト
- タスク 3: プロジェクトにデータを追加する
- タスク4:プロジェクトでチューニング実験を行う
- タスク5:チューニング実験の設定
- タスク6:チューニングしたモデルをデプロイメント・スペースにデプロイする
- タスク7:チューニングしたモデルのテスト
このチュートリアルを完了するためのヒント
このチュートリアルを成功させるためのヒントを紹介します。
ビデオのピクチャー・イン・ピクチャーを使う
次のアニメーション画像は、ビデオのピクチャー・イン・ピクチャーと目次機能の使い方を示しています:
地域の助けを借りる
このチュートリアルで助けが必要な場合は、watsonx コミュニティ ディスカッション フォーラムで質問したり、答えを見つけることができます。
ブラウザのウィンドウを設定する
このチュートリアルを最適に完了するには、Cloud Pak for Data を 1 つのブラウザ ウィンドウで開き、このチュートリアルのページを別のブラウザ ウィンドウで開いておくと、2 つのアプリケーションを簡単に切り替えることができます。 2つのブラウザウィンドウを横に並べると、より見やすくなります。
タスク 1:プロジェクトを開く
このタスクをプレビューするには、00:04から始まるビデオを見てください。
チューニング実験を保存するプロジェクトが必要だ。 サンドボックスプロジェクトを作成し、サービスを関連付ける方法をビデオでご覧ください。 次に、既存のプロジェクトがあることを確認するか、プロジェクトを作成する手順に従ってください。
既存プロジェクトの検証または新規プロジェクトの作成
watsonx ホーム画面で、プロジェクト セクションまでスクロールします。 表示されているプロジェクトがあれば、Associate the Watson Machine Learning serviceまでスキップします。
プロジェクトが表示されない場合は、このビデオを見て、手順に従ってプロジェクトを作成してください。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
サンドボックスプロジェクトを作成をクリックします。 プロジェクトが作成されると、プロジェクトセクションにサンドボックスが表示されます。
既存のプロジェクトまたは新しいサンドボックスプロジェクトを開きます。
Watson Machine Learning サービスをプロジェクトに関連付ける
foundation modelの調整にはWatson Machine Learningを使用するため、以下の手順に従ってWatson Machine Learningサービス・インスタンスをプロジェクトに関連付けます。
プロジェクトで、管理タブをクリックします。
サービス & 統合ページをクリックします。
このプロジェクトに関連する Watson Machine Learning サービスがあるかどうかを確認します。 関連するサービスがない場合は、以下の手順に従ってください:
サービスを関連付けるをクリックします。
Watson Machine Learning サービスインスタンスの横にあるチェックボックスをオンにします。
アソシエイトをクリックします。
必要に応じて、キャンセルをクリックし、サービス & 統合ページに戻ります。
詳細またはビデオを見るには、プロジェクトの作成とプロジェクトに関連サービスを追加するを参照してください。
進捗状況を確認する
次の図は、管理タブと関連するサービスを示しています。 これでサンプルノートブックをプロジェクトに追加する準備ができました。
タスク2:ベースモデルのテスト
このタスクをプレビューするには、00:19から始まるビデオを見てください。
チューニングしたモデルは、プロンプト・ラボでテストすることができます。 以下の手順に従って、チューニングしたモデルをテストしてください:
watsonx ホーム画面に戻る。
サンドボックス・プロジェクトが選択されていることを確認する。
Open Prompt Labタイルをクリックします。
チューニングモデルをお選びください。
- モデルのドロップダウンリストをクリックし、View all foundation modelsを選択します。
- granite-13b-instruct-v2モデルを選択する。
- モデルを選択をクリックします。
Structuredタブをクリックする。
インストラクションにはこう入力する:
Summarize customer complaints
例題とテスト入力を提供する。
入出力例 入力例 出力例 キャピタル・ワンを使っていたことを最初の日に忘れていて、この借金はキャピタル・ワンの手に渡り、そのままになっていた。 債権回収、副産物:クレジットカードの債務、問題:否定的または法的措置を取った、または取る恐れがある 副問題 私はなりすましの被害者であり、この借金は私のものではありません。 ID盗難報告書および法的宣誓供述書をご覧ください。 債権回収、副産物、私は知らない、問題。 支払義務のない債務を回収しようとする。 個人情報窃盗の結果、借金をした Tryテキストフィールドに、以下のプロンプトをコピー&ペーストする:
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.
Generateをクリックし、結果を確認する。 チューニング・モデルの出力と比較できるように、ベース・モデルの出力をメモしておく。
Save work > Save asをクリックします。
プロンプト・テンプレートを選択します。
名前には、
Base model prompt
と入力します。タスク]で[要約]を選択する。
保存後にプロジェクトで表示を選択します。
保存 をクリックします。
進捗状況を確認する
以下の画像は、プロンプト・ラボの結果です
タスク 3: プロジェクトにデータを追加する
このタスクをプレビューするには、01:12から始まるビデオを見てください。
トレーニングデータをプロジェクトに追加する必要があります。 リソース・ハブ・ページには、顧客からの苦情データセットがあります。 このデータセットには、信用報告書に関する典型的な顧客からの苦情という架空のデータが含まれている。 以下の手順に従って、Resource ハブのデータセットをプロジェクトに追加してください:
- リソースハブページの顧客苦情データセットにアクセスする。
- プロジェクトに追加をクリックしてください。
- サンドボックスプロジェクトを選択します。
- 追加 をクリックします。
- View project をクリックすると、プロジェクト内のアセットが表示されます。
進捗状況を確認する
次の画像は、プロジェクトに追加されたデータ資産を示しています。
チューニング実験を行う
タスク4:プロジェクトでチューニング実験を行う
このタスクをプレビューするには、01:32から始まるビデオを見てください。
これで、サンドボックスプロジェクトで、プロジェクトに追加したデータセットを使用するチューニング実験を作成する準備が整いました。 以下の手順に従って、チューニング実験を作成します:
watsonx ホーム画面に戻る。
サンドボックス・プロジェクトが選択されていることを確認する。
ラベル付きデータのあるfoundation modelモデルをチューニングする。
名前にはこう入力する:
Summarize customer complaints tuned model
説明には、こう入力する:
Tuning Studio experiment to tune a foundation model to handle customer complaints.
「作成」 をクリックします。 Tuning Studioが表示されます。
進捗状況を確認する
次の図は、Tuning StudioでTuning実験を開いているところです。
チューニング実験を設定する準備ができました
タスク5:チューニング実験の設定
このタスクをプレビューするには、01:47から始まるビデオを見てください。
Tuning Studio では、チューニング実験を設定することができます。 チューニングのためのfoundation modelが完成した。 以下の手順に従って、調整実験を設定する:
チューニングするfoundation modelのために、 foundation modelの選択をクリックします。
granite-13b-instruct-v2を選択する。
「選択」をクリックします。
プロンプトを初期化するメソッドには、テキストを選択する。 以下の 2 つのオプションがあります。
- テキスト:指定したテキストを使用します。
- ランダム:チューニング実験の一環として生成された値を使用する。
テキストフィールドには、次のように入力する:
Summarize the complaint provided into one sentence.
次の表は各タスクタイプのテキストの例である:
タイトル タスク・タイプ 例 分類 各コメントのセンチメントがポジティブかネガティブかを分類する 生成 週に数日の在宅勤務を認めるケースを作る 要約 会議の記録から要点を要約する モデルにやらせたいことに最も近いタスクタイプで、要約を選択する。 タスクの種類は3つある:
- 要約は、テキスト本文に表現されている主要なアイデアを説明するテキストを生成する。
- Generationは、プロモーションメールのようなテキストを生成します。
- 分類は特徴量からカテゴリラベルを予測する。 例えば、顧客からのコメント一式があった場合、それぞれの文に質問や問題点などのラベルを付けるとよい。 分類タスクを使うとき、モデルに使わせたいクラスラベルをリストする必要がある。 チューニング・トレーニング・データと同じラベルを指定する。
プロジェクトからトレーニングデータを選択します。
- プロジェクトから選択をクリックします。
- データ資産をクリックします。
- customer complaints training data.json ファイルを選択します。
- 「資産の選択 (Select asset)」 をクリックします。
- チューニングを開始をクリックします。
進捗状況を確認する
次の図は、設定されたチューニング実験を示している。
次に、結果を確認し、調整したモデルをデプロイする
タスク6:チューニングしたモデルをデプロイメントスペースにデプロイする
このタスクをプレビューするには、03:17から始まるビデオをご覧ください。
実験の実行が完了すると、チューニングされたモデルとロス関数チャートが表示されます。 損失関数は、各トレーニング実行での予測結果と実際の結果の差を測定します。 以下の手順に従って、損失関数図とチューニングされたモデルを表示します:
ロス・ファンクション・チャートを見直す。 下向きのカーブは、モデルが期待されるアウトプットを生成する能力が向上していることを意味する。
チャートの下にある、顧客からの苦情をまとめる調整モデルをクリックします。
モデルの詳細をスクロールする。
「デプロイ」 をクリックします。
名前には
Summarize customer complaints tuned model
デプロイメント・コンテナでは、デプロイメント・スペースを選択します。
ターゲット配置スペースでは、既存の配置スペースを選択します。 既存の配置スペースがない場合は、次の手順に従います:
- 対象の配置スペースで、新しい配置スペースを作成するを選択します。
- デプロイメントスペース名には、次のように入力する:
Foundation models deployment space
と入力します - リストからストレージ・サービスを選択します。
- プロビジョニングされた機械学習サービスをリストから選択する。
- 「作成」 をクリックします。
- 閉じるをクリックします。
- ターゲット配置スペースで、基盤モデル配置スペースが選択されていることを確認します。
作成後に配置スペースで配置を表示するオプションをオンにします。
「作成」 をクリックします。
Deployments ページで、Summarize customer complaints tuned model 配置をクリックして詳細を表示します。
進捗状況を確認する
次の図は、配置スペースでの配置を示しています。 これで、デプロイされたモデルをテストする準備が整いました。
タスク7:チューニングしたモデルをテストする
このタスクをプレビューするには、04:04から始まるビデオを見てください。
チューニングしたモデルは、プロンプト・ラボでテストすることができます。 以下の手順に従って、チューニングしたモデルをテストしてください:
モデルの配置ページから、Open in prompt lab をクリックし、サンドボックス プロジェクトを選択します。 プロンプト・ラボが表示されます。
チューニングモデルをお選びください。
- モデルのドロップダウンリストをクリックし、View all foundation modelsを選択します。
- Summarize customer complaints tuned model モデルを選択します。
- モデルを選択をクリックします。
構造化モードのページで、指示を入力する:
Summarize customer complaints
構造化モードページで、例とテスト入力を提供する。
入出力例 入力例 出力例 キャピタル・ワンを使っていたことを最初の日に忘れていて、この借金はキャピタル・ワンの手に渡り、そのままになっていた。 債権回収、副産物:クレジットカードの債務、問題:否定的または法的措置を取った、または取る恐れがある 副問題 私はなりすましの被害者であり、この借金は私のものではありません。 ID盗難報告書および法的宣誓供述書をご覧ください。 債権回収、副産物、私は知らない、問題。 支払義務のない債務を回収しようとする。 個人情報窃盗の結果、借金をした Tryテキストフィールドに、以下のプロンプトをコピー&ペーストする:
After I reviewed my credit report, I am still seeing information that is reporting on my credit file that is not mine. please help me in getting these items removed from my credit file.
Generateをクリックし、結果を確認する。 ベースモデルの出力とチューニングモデルの出力を比較する。
進捗状況を確認する
以下の画像は、プロンプト・ラボの結果です
今後のステップ
他のチュートリアルもお試しください:
その他のリソース
詳しくは、 ビデオを参照してください。
サンプルデータセット、プロジェクト、モデル、プロンプト、ノートブックをリソースハブで見つけて、実践的な経験を積むことができます:
ノートブックをプロジェクトに追加することで、データの分析やモデルの構築を始めることができます。
ノートブック、データセット、プロンプト、その他のアセットを含むインポート可能なプロジェクト。
プロジェクトを改良、分析、モデル構築するために追加できるデータセット。
プロンプト 。プロンプト・ラボで基盤モデルのプロンプトを出すために使用できます。
プロンプト・ラボで使用できる 基盤モデル 。
親トピック: クイック・スタート・チュートリアル