0 / 0
Go back to the English version of the documentation
管理部署的硬件规范
Last updated: 2024年12月09日
管理部署的硬件规范

在watsonx.aiRuntime 中部署特定资产时,您可以选择符合您计算需求的硬件配置类型、大小和功率。

为部署创建硬件规范

您可以通过以下方式为部署创建硬件规范:

  • Python 客户机库: 使用 Python 客户机库中的 hardware_specifications.store 函数。 有关更多信息,请参阅 Python 客户机库参考
  • 数据与人工智能通用核心 API:使用数据和人工智能通用核心 API 环境列表中的 "POST /v2/hardware_specifications创建硬件规范。 有关更多信息,请参阅 环境 API 参考

需要硬件规范的部署类型

选择硬件规范可用于所有 批处理部署 类型。 对于 联机部署,您可以选择特定硬件规范 (如果要部署):

  • Python 函数
  • Tensorflow 模型
  • 具有定制软件规范的模型

可用于部署资产的硬件配置

  • XS: 1x4 = 1 vCPU 和 4 GB RAM
  • S: 2x8 = 2 vCPU 和 8 GB RAM
  • M: 4x16 = 4 vCPU 和 16 GB RAM
  • L: 8x32 = 8 vCPU 和 32 GB RAM
  • XL: 16x64 = 16 vCPU 和 64 GB RAM

您可以使用 XS 配置来部署:

  • Python 函数
  • Python 脚本
  • R 脚本
  • 基于定制库和定制图像的模型

对于 Decision Optimization 部署,您可以使用以下硬件规范:

  • S
  • M
  • L
  • XL

GPU 推断的硬件规范

从Cloud Pak for Data 4.8.5 版开始,您可以在创建部署时,在 "x86平台的用户界面上为 CUDA 软件规格选择 GPU 硬件规格。

对于 GPU 推断,请使用以下预定义硬件规范:

了解更多信息

父主题: 管理预测性部署

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more