0 / 0
資料の 英語版 に戻る
デプロイメントのスケーリング
最終更新: 2024年11月21日
デプロイメントのスケーリング

デプロイメント・スペースから、またはプログラマチックに、モデルまたは機能のオンライン・デプロイメントを作成すると、デフォルトで資産の単一コピーがデプロイされます。 スケーラビリティーと可用性を強化するため、デプロイメントの構成を編集してコピー (レプリカ) の数を増やすことができます。 コピーの数が多いほど、スコアリング要求の量が多くなります。

以下の方法で、デプロイメントをスケーリングできます。

  • デプロイメント・スペースでデプロイメントの構成を更新する。
  • プログラム的には、watsonx.aiRuntimePythonクライアントライブラリ、またはwatsonx.aiRuntime REST API を使用します。

開始前に

APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、タスク資格情報の管理を参照のこと。

スペースからのオンライン・デプロイメントのコピー数の変更

  1. デプロイメント・スペースの 「デプロイメント」 タブをクリックします。
  2. デプロイメント名のアクション・メニューから、 「編集」をクリックします。
  3. 「デプロイメントの編集」 ダイアログ・ボックスで、コピーの数を変更し、 「保存」をクリックします。

プログラムによるデプロイメントのレプリカの数の増加

デプロイメントをプログラムによってスケーリングする作業のサンプルを表示または実行するには、デプロイメントのメタデータでレプリカの数を増やすことができます。

Python の例

Python クライアントを使用してレプリカの数を 3 に設定する例を以下に示します。

change_meta = {
                client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
                                       "name":"S",
                                       "num_nodes":3}
            }

client.deployments.update(<deployment_id>, change_meta)

API では名前または ID を指定する必要があるため、 HARDWARE_SPEC 値には名前が含まれます。

REST API の例

curl -k -X PATCH -d '[ { "op": "replace", "path": "/hardware_spec", "value": {  "name": "S", "num_nodes": 2  } } ]' <Deployment end-point URL>

hardware_spec 値には名前を指定する必要がありますが、この引数はスケーリングには適用されません。

親トピック: 予測デプロイメントの管理

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細