基礎モデルのオンデマンド展開(ファストパス)
数ステップで、専用ハードウェア上にオンデマンドで基盤モデルを展開できます。 IBM watsonx.ai 厳選された人気の高い基盤モデルを提供しており、そのスペースにアクセスできるユーザーのみが利用できるデプロイメントスペースに、オンデマンドで展開することができます。 オンデマンドで基盤モデルを展開するための高速な方法は、リソースハブからモデルを選択して展開することです。
開始前に
- 基礎モデルをオンデマンドでデプロイするには、タスク認証情報を設定するか、有効にする必要があります。 詳細については、タスク資格情報の管理を参照のこと。
- オンデマンド基盤モデルを展開するための、サポートされている基盤モデルアーキテクチャ、 デプロイメントタイプ、その他の考慮事項を確認する。 詳しくは、基礎モデルをオンデマンドで展開するを参照してください。
このビデオでは、オンデマンドで基盤モデルを展開する方法をご覧いただけます。
このビデオは、このドキュメントのコンセプトとタスクを学ぶための視覚的な方法を提供します。
オンデマンド基盤モデルを展開する
リソースハブからオンデマンドで基盤モデルを展開するには、以下の手順を完了します
ナビゲーションメニュー「
」からリソースハブを開く。
ヒント:Deploy-on-demandfilerを選択すると、オンデマンドでデプロイできるモデルのリストが表示されます。
時間単位の支払いセクションから、オンデマンドで展開したいモデルを見つけます。
モデルの詳細ページから、Deployをクリックします。
基盤モデルから 「デプロイ」 をクリックし、 基盤モデルデプロイデプロイメントスペースを選択します。
重要:デプロイメントスペース、オンデマンドでデプロイできる基盤モデルインスタンスは1つだけです。 選択したモデルがすでにデプロイされている場合は、[詳細]セクションの下に既存のデプロイ リンクが表示されます。 詳細については、 watsonx.ai ランタイムのトラブルシューティングを参照してください。
「作成」 をクリックします。
モデルがデプロイされた後、 Prompt Lab または watsonx.ai APIから基盤モデルを呼び出すことができます。
デプロイメントのテスト
オンデマンドで展開された基盤モデルをテストするには、以下の手順に従います
配置スペースで[配置]タブを開き、配置名をクリックします。
テスト]タブをクリックして、プロンプトのテキストを入力し、配置された資産からの応答を取得します。
デプロイしたアセットのタイプに応じて、以下のいずれかの形式でテストデータを入力してください:
a. テキスト:テキスト入力データを入力し、出力としてテキストブロックを生成する。
b. ストリーム:テキスト入力データを入力して、出力としてテキストのストリームを生成する。
c. JSON:JSON形式の出力を生成するためにJSON入力データを入力します。プロンプトに基づいた結果を得るには、[生成]をクリックします。
配備の管理
リソースハブからオンデマンドで展開された基盤モデルにアクセスし、更新、拡張、削除することができます。
デプロイされたモデルへのアクセス
リソースハブからデプロイメントを使用して、オンデマンドでデプロイされた基盤モデルにアクセスできます。
リソースハブから配置リンクにアクセスするには、次の手順に従います:
ナビゲーションメニューから、リソースハブを開きます。
リソース・ハブのFoundation モデル・カタログから、デプロイしたモデルを選択します。
モデルの詳細ページのDetailsセクションで、Deploymentリンクをクリックします。
また、 デプロイメントから、オンデマンドでデプロイされた基盤モデルの詳細 (デプロイメント、ソフトウェア仕様、 資産など)にアクセスすることもできます。
配置の更新
オンデマンドで展開される基盤モデルに必要な詳細情報(名前、説明、タグなど)を更新します。 詳細は、「配置を更新する」を参照してください。
配備の拡大
デプロイメントスペース、オンデマンドでデプロイできる基盤モデルインスタンスは1つだけです。 需要の増加に対応するために、追加のコピーを作成することで配備を拡張できます。 詳細については、「配置をスケーリングする」を参照してください。
デプロイメントの削除
オンデマンドで展開された基盤モデルでの作業が完了したら、課金を停止するためにデプロイメント削除します。 詳細は、「配置を削除する」を参照してください。
詳細情報
親トピック 基礎モデルのオンデマンド展開