調整された基盤モデル展開
モデルをチューニングして、特定のタスク、データセット、ユースケースに適応させることができます。 チューニングプロセスは、事前に訓練されたモデルのパラメータや重みを調整し、モデルの性能や精度を向上させる。 チューニングされたモデルを配備することで、ビジネス・ワークフローに追加し、有意義な方法で基盤モデル使用を開始することができます。
働き方
どの方法でモデルをチューニングするにしても、チューニングしたモデルをデプロイする前に、チューニング実験の終了を待たなければなりません。
モデルをトレーニングするために選択した方法に応じて、チューニングしたモデルを以下の方法で展開することができます:
- プロジェクトUIからチューニング実験資産プロジェクトに保存されているチューニング済みモデルを展開するためのグラフィカル・ユーザー・インターフェース。 詳細については、 プロジェクトからチューニングされたモデルをデプロイするを参照してください。
- チューニングされたモデルを展開するためのプログラム手法:パラメータ効率に優れたファイン・チューニング (PEFT)モデルには、これらのメソッドを使用します。
チューニングされたモデルをデプロイした後は、テキストデータを入力としてモデルを推論し、リアルタイムで予測を生成することができます。
プロジェクトからチューニングされたモデルをデプロイする
Tuning Studio を使ってチューニング実験を作成すると、その結果得られたチューニング・モデルを直接配備することができます。
開始前に
APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、タスク資格情報の管理を参照のこと。
手順
チューニングされたモデルを配備するには、以下の手順を実行します:
プロジェクトの 資産 タブから、 実験 資産クリックします。
展開したいモデルのチューニング実験を開くにはクリックしてください。
Tuned modelsリストから、完了したチューニング実験を見つけ、New deploymentをクリックします。
チューニングされたモデルを挙げる。
チューニング実験の名前は、変更しなければチューニングされたモデル名として使用されます。 この名前には、括弧で囲まれた数字が後に付いている。 数字は1から始まり、このチューニング実験を行うたびに1ずつ増えていく。
オプション:説明とタグを追加します。
デプロイメント・コンテナでは、以下のオプションのいずれかを選択する:
- このプロジェクト:チューニングされたモデルをデプロイし、チューニングされたモデルをテストできるプロジェクトに追加します。 調整済みモデルの配置は、いつでも配置スペースに昇格できます。 チューニングされたモデルを本番で使用する前に、より多くのテストを行いたい場合は、このオプションを選択してください。
- デプロイメントスペース:チューニングされたモデルをデプロイメントスペースにプロモートし、チューニングされたモデルをデプロイします。 配置スペースは、アセットを作成するプロジェクトとは別のものです。 この分離により、複数のプロジェクトから1つのスペースにアセットをプロモートしたり、複数のスペースにアセットをデプロイしたりすることができます。 このオプションは、チューニングされたモデルを本番用に昇格させる準備ができたときに選択します。
このオプションの詳細については、配置スペースを使用するを参照してください。
ヒント: 作成後に表示するオプションを選択すると、 デプロイメント完了した後 にチューニングしたモデルを簡単に見つけることができます。「デプロイ」 をクリックします。
チューニングされたモデルがデプロイされると、チューニングされたモデルのコピーがモデルアセットとしてプロジェクトに保存されます。
配置スペースの使用
調整済みモデルのコンテナとしてデプロイメントスペースを選択すると、調整済みモデルはデプロイメントスペースに昇格され、デプロイされます。 デプロイメントスペースは、アセットをデプロイするために使用する以下のサービスと関連付けられます:
watsonx.aiランタイム:機械学習モデルの構築、トレーニング、デプロイに使用できるツールとサービスを備えた製品。 このサービスは、あなたのターンモデルをホスティングします。
IBM Cloud Object Storage:構造化データおよび非構造化データを保存するためのセキュアなプラットフォーム。 デプロイされたモデル アセットは、プロジェクトに関連付けられている Cloud Object Storage バケットに格納されます。
詳しくは、Deployment spaces を参照してください。
配置スペースを使用するには、以下の手順を実行します:
配置コンテナとして配置スペースを選択したら、ターゲット配置スペースフィールドで配置スペースを選択します。
デプロイメントスペースは、チューニングされたモデルが作成されたプロジェクトと同じアカウントにある機械学習インスタンスに関連付けられていなければならない。
配置スペースがない場合は、新しい配置スペースを作成するを選択し、配置スペースを作成するの手順に従ってください。
配置サービング名フィールドに、配置のラベルを追加します。
サービング名は、 デプロイメント識別する API エンドポイントの URL で使用されます。 名前を追加すると、システムで生成された長いIDの代わりに、人間が読める名前が割り当てられるので便利です。
サービング名はまた、デプロイメントをサービスインスタンスの詳細から抽象化します。 アプリケーションはこの名前を参照できるため、ユーザーに影響を与えることなく、基盤となるサービス・インスタンスを変更することができる。
名前は36文字まで。 サポートされている文字は [a-z,0-9,_] です。
この名前は、IBM Cloud リージョン全体で一意でなければなりません。 選択した名前がすでに使用されている場合は、サービング名を変更するよう促されることがあります。
モデルのデプロイメント取得
以下の手順に従って、チューニング済みモデルデプロイメントエンドポイント URL を取得します:
- プロジェクトまたはデプロイメント・スペース デプロイメント タブで、 デプロイメント名をクリックします。
- APIリファレンス・ タブでは、プライベート・エンドポイントとパブリック・エンドポイントのリンクと、アプリケーションにエンドポイントの詳細を含めるために使用できるコード・スニペットを見つけることができます。
アプリケーションからデプロイメントアクセスするには、モデルのエンドポイント URL が必要です。
次のステップ
チューニングされたモデルをデプロイしたら、推論によってモデルをテストすることができる。 デプロイメント詳細を更新、スケーリング、または削除することで、モデルのデプロイメント管理できます。
詳細情報
親トピック: 基盤モデル 資産の展開