チューニングされたモデルをデプロイすることで、ビジネス・ワークフローに追加し、基礎モデルを有意義に使い始めることができます。
開始前に
foundation modelのチューニングに使用したチューニング実験は終了していなければならない。 詳しくは、 foundation modelのチューニングをご覧ください。
APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、タスク資格情報の管理を参照のこと。
チューニング・モデルの展開
チューニングされたモデルを配備するには、以下の手順を実行します:
ナビゲーションメニューからプロジェクトを展開し、すべてのプロジェクトをクリックします。
クリックするとプロジェクトが開きます。
資産タブから、実験資産タイプをクリックします。
展開したいモデルのチューニング実験を開くにはクリックしてください。
Tuned modelsリストから、完了したチューニング実験を見つけ、New deploymentをクリックします。
チューニングされたモデルを挙げる。
チューニング実験の名前は、変更しなければチューニングされたモデル名として使用されます。 この名前には、括弧で囲まれた数字が後に付いている。 数字は1から始まり、このチューニング実験を行うたびに1ずつ増えていく。
オプション:説明とタグを追加します。
デプロイメント・コンテナでは、以下のオプションのいずれかを選択する:
- このプロジェクト:チューニングされたモデルをデプロイし、チューニングされたモデルをテストできるプロジェクトに追加します。 調整済みモデルの配置は、いつでも配置スペースに昇格できます。 チューニングされたモデルを本番で使用する前に、より多くのテストを行いたい場合は、このオプションを選択してください。
- デプロイメントスペース:チューニングされたモデルをデプロイメントスペースにプロモートし、チューニングされたモデルをデプロイします。 配置スペースは、アセットを作成するプロジェクトとは別のものです。 この分離により、複数のプロジェクトから1つのスペースにアセットをプロモートしたり、複数のスペースにアセットをデプロイしたりすることができます。 このオプションは、チューニングされたモデルを本番用に昇格させる準備ができたときに選択します。
このオプションの詳細については、配置スペースを使用するを参照してください。
ヒント:作成後に表示するオプションを選択します。 そうでない場合は、配備モデルを見つけるためにさらに多くのステップを踏む必要がある。
「デプロイ」 をクリックします。
チューニングされたモデルがデプロイされると、チューニングされたモデルのコピーがモデルアセットとしてプロジェクトに保存されます。
配置スペースの使用
調整済みモデルのコンテナとしてデプロイメントスペースを選択すると、調整済みモデルはデプロイメントスペースに昇格され、デプロイされます。 デプロイメントスペースは、アセットをデプロイするために使用する以下のサービスと関連付けられます:
watsonx.aiランタイム:機械学習モデルの構築、トレーニング、デプロイに使用できるツールとサービスを備えた製品。 このサービスは、あなたのターンモデルをホスティングします。
IBM Cloud Object Storage:構造化データおよび非構造化データを保存するためのセキュアなプラットフォーム。 デプロイされたモデル アセットは、プロジェクトに関連付けられている Cloud Object Storage バケットに格納されます。
詳しくは、Deployment spaces を参照してください。
配置スペースを使用するには、以下の手順を実行します:
配置コンテナとして配置スペースを選択したら、ターゲット配置スペースフィールドで配置スペースを選択します。
デプロイメントスペースは、チューニングされたモデルが作成されたプロジェクトと同じアカウントにある機械学習インスタンスに関連付けられていなければならない。
配置スペースがない場合は、新しい配置スペースを作成するを選択し、配置スペースを作成するの手順に従ってください。
配置サービング名フィールドに、配置のラベルを追加します。
サービング名は、デプロイメントを識別する API エンドポイントの URL で使用されます。 名前を追加すると、システムで生成された長いIDの代わりに、人間が読める名前が割り当てられるので便利です。
サービング名はまた、デプロイメントをサービスインスタンスの詳細から抽象化します。 アプリケーションはこの名前を参照できるため、ユーザーに影響を与えることなく、基盤となるサービス・インスタンスを変更することができる。
名前は36文字まで。 サポートされている文字は [a-z,0-9,_] です。
この名前は、IBM Cloud リージョン全体で一意でなければなりません。 選択した名前がすでに使用されている場合は、サービング名を変更するよう促されることがあります。
導入モデルのテスト
チューニングされたモデルの真のテストは、チューニングされたパターンに従った入力にどう反応するかだ。
チューニングされたモデルは、以下のいずれかのページからテストできます:
- プロジェクト:開発およびテストフェーズで、モデルを本番に移行する前にテストしたい場合に便利です。
- デプロイメントスペース:プログラムでモデルをテストしたい場合に便利です。 APIリファレンスタブでは、利用可能なエンドポイントやコード例に関する情報を見ることができます。 また、入力をテキストとして送信し、出力が生成される際に、出力を返すかストリームで返すかを選択することもできる。 ただし、入力テキストのプロンプト・パラメーターを変更することはできない。
- プロンプト・ラボ:基礎モデルのプロンプトに直感的なユーザーインターフェイスを持つツールを使いたい場合に便利です。 入力ごとにプロンプトパラメータをカスタマイズできる。 また、プロンプトをノートブックとして保存し、プログラムで操作することもできる。
プロジェクトでデプロイメント・モデルをテストする
チューニングしたモデルをプロジェクトでテストするには、以下のステップを完了する:
プロジェクトで、Deploymentsタブをクリックします。
配置したモデルの名前をクリックします。
テストタブをクリックします。
入力データフィールドに、調整済みモデルが認識するようにトレーニングされたプロンプトパターンに従ったプロンプトを追加し、生成をクリックします。
View parameter settingsをクリックすると、デフォルトでモデルに適用されるプロンプトパラメータを見ることができます。 プロンプトパラメーターを変更するには、プロンプトラボに行く必要がある。
展開空間での展開モデルのテスト
調整したモデルを配置スペースでテストするには、以下の手順を実行します:
ナビゲーションメニューから、デプロイメントを選択します。
調整済みモデルを配置した配置スペースの名前をクリックします。
配置したモデルの名前をクリックします。
テストタブをクリックします。
入力データフィールドに、調整済みモデルが認識するようにトレーニングされたプロンプトパターンに従ったプロンプトを追加し、生成をクリックします。
View parameter settingsをクリックすると、デフォルトでモデルに適用されるプロンプトパラメータを見ることができます。 プロンプトパラメーターを変更するには、プロンプトラボに行く必要がある。
Prompt Labで展開モデルをテストする
チューニングしたモデルをプロンプト・ラボでテストするには、以下の手順を実行します:
前の手順の手順に従って、プロジェクトまたは配置スペースのいずれかでデプロ イされたモデルを開きます。
プロジェクトで、プロンプト・ラボで開くをクリックします。 配置スペースで作業している場合は、モデルで作業するプロジェクトを選択するよう促されます。
Prompt Labが開き、Modelフィールドからデプロイしたチューニングモデルが選択されます。
Tryセクションで、Inputフィールドに、調整済みモデルが認識できるようにトレーニングされたプロンプトパターンに従ったプロンプトを追加し、Generateをクリックします。
プロンプトエディターの使い方については、プロンプトラボを参照してください。
詳細情報
親トピック foundation model資産の展開