プロンプト・テンプレートをデプロイして、ビジネス・ワークフローに追加したり、パフォーマンスを測定するためにプロンプト・テンプレートを評価したりすることができます。
デプロイメント・スペースへのプロンプト・テンプレートのプロモートCopy link to section
プロンプトテンプレートをデプロイメントスペースに昇格させるには、プロンプトテンプレートに少なくとも1つの変数が含まれている必要があります。
変数を含まないプロンプト テンプレートを配置スペースに昇格させることはできません。
変数なしのプロンプト テンプレートを配置するには、プロンプト テンプレート アセットを含むプロジェクトをエクスポートし、そのプロジェクトを配置スペースにインポートする必要があります。 詳細は、プロンプトテンプレートを配置スペースにインポートするを参照してください。
プロンプトテンプレートを配備する際の追加の注意事項を以下に示す:
- モデルのデプロイメントを参照するプロンプト・テンプレートは、モデルのデプロイメントを 作成したのと同じプロジェクトまたはスペースでのみ作成できます。 配置されたモデルを参照するテンプレートをスペースにプロモートすると、モデル資産のコピーが自動的にスペースに追加されます。 プロンプトテンプレートをデプロイする前に、スペースにモデルをデプロイする必要があります。
- デプロイされたモデルを参照するプロンプトテンプレートをエクスポートすると、関連するモデルアセットが自動的にプロンプトテンプレートと一緒にエクスポートされます。 テンプレートを新しいコンテナにインポートすると、モデルもインポートされます。 プロンプトテンプレートをデプロイする前に、モデルを新しいコンテナにデプロイする必要がある。
開始前にCopy link to section
少なくとも 1 つの変数を含むプロンプト・テンプレートをプロジェクト資産として保存します。 再使用可能プロンプトの作成を参照してください。
APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、タスク資格情報の管理を参照のこと。
手順Copy link to section
プロンプト・テンプレートをデプロイするには、以下のステップを実行します。
- プロンプト・テンプレートを含むプロジェクトを開きます。
- テンプレートの 「スペースにプロモート」 をクリックします。
「ターゲット・デプロイメント・スペース」 フィールドで、デプロイメント・スペースを選択するか、新規スペースを作成します。 以下の点に注意してください。
デプロイメント・スペースは、プロンプト・テンプレートが作成されたプロジェクトと同じアカウントにある機械学習インスタンスに関連付けられている必要があります。
デプロイメント・スペースがない場合は、 「新規デプロイメント・スペースの作成」を選択し、 デプロイメント・スペースの作成の手順に従います。
スペース内のプロンプト・テンプレートを評価する予定の場合、スペースの推奨される 「デプロイメント・ステージ」 タイプは 「実稼働」です。 評価について詳しくは、 デプロイメント・スペースでのプロンプト・テンプレートの評価を参照してください。
注: スペースの作成後にデプロイメント・スペース・ステージを変更することはできません。ヒント: 「作成後にデプロイメント・スペース内のデプロイメントを表示する」を選択します。 そうでない場合は、導入済みの資産を見つけるために追加のステップを実行する必要があります。
デプロイメント・スペースの 「資産」 タブで、 「デプロイ」をクリックします。 オンライン・デプロイメントを作成します。これは、データをエンドポイントに送信し、リアルタイムで応答を受信できることを意味します。
オプション: 「デプロイメント・サービス名」 フィールドに、デプロイメントの固有のラベルを追加します。
サービング名は、デプロイメントを識別する API エンドポイントの URL で使用されます。 名前を追加すると、追加する人間が理解できる名前によって、システムが生成する長い固有 ID が置き換えられるため、名前を追加すると便利です。
また、サービス名は、サービス・インスタンスの詳細からデプロイメントを抽象化します。 アプリケーションはこの名前を参照します。これにより、ユーザーに影響を与えることなく、基礎となるサービス・インスタンスを変更できます。
名前には、最大 36 文字を使用できます。 サポートされる文字は [a-z,0-9, _] です。
この名前は、 IBM Cloud リージョン全体で固有でなければなりません。 選択した名前が既に使用されている場合は、サービス名の変更を求めるプロンプトが出されることがあります。
プロンプト テンプレートを配置スペースにインポートするCopy link to section
変数なしのプロンプト テンプレートを配置するには、プロンプト テンプレート アセットを含むプロジェクトをエクスポートし、そのプロジェクトを配置スペースにインポートする必要があります。
開始前にCopy link to section
プロンプト テンプレート アセットを含むプロジェクトを ZIP ファイルとしてエクスポートします。
手順Copy link to section
プロンプト テンプレート アセットを配置スペースにインポートするには、次の手順を 実行します:
配置スペースのツールバーから、「Export/Import space'
ドロップダウンメニューを選択し、「Import space」をクリックします。
プロジェクトからエクスポートしたプロンプト テンプレート アセットを含む ZIP ファイルをアップロードし、完了をクリックします。
デプロイされたプロンプト・テンプレートのテストCopy link to section
デプロイメントが正常に完了したら、デプロイメント名をクリックしてデプロイメントを表示します。
- 「API リファレンス」 タブには、このプロンプト・テンプレートをアプリケーションに追加するために必要な API エンドポイントとコード・スニペットが含まれています。
- 「テスト」 タブでは、プロンプト・テンプレートのテストがサポートされます。 テスト・データをテキスト、ストリーム・テキスト、または JSON ファイルとして入力します。
watsonx.governance サービスが有効になっている場合は、以下のタブも表示されます。
- Evaluate は、スペース内のプロンプト・テンプレートを評価するためのツールを提供します。 「アクティブ化」 をクリックして、評価するディメンションを選択します。 詳しくは、「 プロンプト・テンプレートの評価」を参照してください。
- AI Factsheets には、プロンプト・テンプレート用に収集されたすべてのメタデータが表示されます。 これらの詳細を使用して、ガバナンスおよびコンプライアンスの目標のプロンプト・テンプレートを追跡します。 「 プロンプト・テンプレートのトラッキング」を参照してください。
プログラムによるプロンプトテンプレートの配置Copy link to section
プロンプトテンプレートをプログラムでデプロイする場合、以下の手順に従う必要がある:
- モデルアセットとプロンプトテンプレートを配置スペースに移動します。 例えば、 watsonx.ai API を使用している場合、テンプレートを取得し、
に格納されているprompt.model_id
を解析します。 Data and AI Common Core APIを使用している場合は、model_id
。 IDは、entity.wx_prompt.prompt.model_id
で分割されたキーの文字列である。 文字列の最後の項目はモデルリソースキーで、テンプレートに関連付けられたモデルアセットを指します。:
- 最初のステップのモデルリソースキーを使って、テンプレートのためにデプロイするモデルを探し、モデルをデプロイします。 たとえば、Data and AI Common Core API APIを使用している場合、検索リクエストはスペースまたはプロジェクトID(
)、ユーザーのトークン(XXX
)、およびプロンプトテンプレートに関連付けられたモデルリソースキー(YYY
)を検索します。ZZZ
curl --location 'https://api.dataplatform.cloud.ibm.com/v2/asset_types/wml_model/search?space_id=XXX' \ --header 'Authorization: Bearer YYY' \ --header 'Content-Type: application/json' \ --data '{ "query": "(asset.resource_key:ZZZ)", "include": "entity", "limit": 100 }'
Copy to clipboard
- モデルが正常にデプロイされたら、プロンプトテンプレートをデプロイする
詳細情報Copy link to section
サンプル・プロンプト・テンプレートを評価および追跡するには、チュートリアル「 クイック・スタート: プロンプト・テンプレートの評価および追跡 」に従ってください。
ノートブックでデプロイされたプロンプト・テンプレートを使用して AI 推論でビジネス・アプリケーションとワークフローを運用化する方法に関するヒントについては、ブログ投稿 IBM watsonx.governance for management and performance assurance of AI models-A prescriptive approach を参照してください。
親トピック: 資産のデプロイおよび管理