0 / 0
Go back to the English version of the documentation
缩放部署
Last updated: 2024年11月21日
缩放部署

当您从部署空间或以编程方式为模型或函数创建联机部署时,缺省情况下会部署该资产的单个副本。 要提高可伸缩性和可用性,您可通过编辑部署配置来增加副本数量。 更多副本允许更大数量的评分请求。

可以通过下列方式缩放部署:

  • 在部署空间中更新部署配置。
  • 使用watsonx.aiRuntimePython客户端库或watsonx.aiRuntime REST API进行编程。

准备工作

您必须通过生成 API 密钥来设置任务凭证。 有关更多信息,请参阅管理任务凭证

从空间更改联机部署的副本数

  1. 单击部署空间的 部署 选项卡。
  2. 从部署名称的操作菜单中,单击 编辑
  3. 在 " 编辑部署 " 对话框中,更改副本数,然后单击 保存

以编程方式增加部署的副本数

要查看或运行以编程方式缩放部署的工作样本,您可在部署元数据中增加副本数。

Python 示例

以下示例使用 Python 客户机将副本数设置为 3。

change_meta = {
                client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
                                       "name":"S",
                                       "num_nodes":3}
            }

client.deployments.update(<deployment_id>, change_meta)

HARDWARE_SPEC 值包含名称,因为 API 需要提供名称或标识。

REST API 示例

curl -k -X PATCH -d '[ { "op": "replace", "path": "/hardware_spec", "value": {  "name": "S", "num_nodes": 2  } } ]' <Deployment end-point URL>

必须为 hardware_spec 值指定名称,但该参数不会应用于缩放。

父主题: 管理预测性部署

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more