資料の 英語版 に戻るデプロイメントのスケーリング
デプロイメントのスケーリング
最終更新: 2024年11月21日
デプロイメント・スペースから、またはプログラマチックに、モデルまたは機能のオンライン・デプロイメントを作成すると、デフォルトで資産の単一コピーがデプロイされます。 スケーラビリティーと可用性を強化するため、デプロイメントの構成を編集してコピー (レプリカ) の数を増やすことができます。 コピーの数が多いほど、スコアリング要求の量が多くなります。
以下の方法で、デプロイメントをスケーリングできます。
- デプロイメント・スペースでデプロイメントの構成を更新する。
- プログラム的には、watsonx.aiRuntimePythonクライアントライブラリ、またはwatsonx.aiRuntime REST API を使用します。
開始前に
APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、タスク資格情報の管理を参照のこと。
スペースからのオンライン・デプロイメントのコピー数の変更
- デプロイメント・スペースの 「デプロイメント」 タブをクリックします。
- デプロイメント名のアクション・メニューから、 「編集」をクリックします。
- 「デプロイメントの編集」 ダイアログ・ボックスで、コピーの数を変更し、 「保存」をクリックします。
プログラムによるデプロイメントのレプリカの数の増加
デプロイメントをプログラムによってスケーリングする作業のサンプルを表示または実行するには、デプロイメントのメタデータでレプリカの数を増やすことができます。
Python の例
Python クライアントを使用してレプリカの数を 3 に設定する例を以下に示します。
change_meta = {
client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
"name":"S",
"num_nodes":3}
}
client.deployments.update(<deployment_id>, change_meta)
API では名前または ID を指定する必要があるため、 HARDWARE_SPEC
値には名前が含まれます。
REST API の例
curl -k -X PATCH -d '[ { "op": "replace", "path": "/hardware_spec", "value": { "name": "S", "num_nodes": 2 } } ]' <Deployment end-point URL>
hardware_spec
値には名前を指定する必要がありますが、この引数はスケーリングには適用されません。
親トピック: 予測デプロイメントの管理