Go back to the English version of the documentation缩放部署
缩放部署
Last updated: 2024年11月21日
当您从部署空间或以编程方式为模型或函数创建联机部署时,缺省情况下会部署该资产的单个副本。 要提高可伸缩性和可用性,您可通过编辑部署配置来增加副本数量。 更多副本允许更大数量的评分请求。
可以通过下列方式缩放部署:
- 在部署空间中更新部署配置。
- 使用watsonx.aiRuntimePython客户端库或watsonx.aiRuntime REST API进行编程。
准备工作
您必须通过生成 API 密钥来设置任务凭证。 有关更多信息,请参阅管理任务凭证。
从空间更改联机部署的副本数
- 单击部署空间的 部署 选项卡。
- 从部署名称的操作菜单中,单击 编辑。
- 在 " 编辑部署 " 对话框中,更改副本数,然后单击 保存。
以编程方式增加部署的副本数
要查看或运行以编程方式缩放部署的工作样本,您可在部署元数据中增加副本数。
Python 示例
以下示例使用 Python 客户机将副本数设置为 3。
change_meta = {
client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
"name":"S",
"num_nodes":3}
}
client.deployments.update(<deployment_id>, change_meta)
HARDWARE_SPEC
值包含名称,因为 API 需要提供名称或标识。
REST API 示例
curl -k -X PATCH -d '[ { "op": "replace", "path": "/hardware_spec", "value": { "name": "S", "num_nodes": 2 } } ]' <Deployment end-point URL>
必须为 hardware_spec
值指定名称,但该参数不会应用于缩放。
父主题: 管理预测性部署