Go back to the English version of the documentation管理部署的硬件规范
管理部署的硬件规范
Last updated: 2024年12月09日
在watsonx.aiRuntime 中部署特定资产时,您可以选择符合您计算需求的硬件配置类型、大小和功率。
为部署创建硬件规范
您可以通过以下方式为部署创建硬件规范:
- Python 客户机库: 使用 Python 客户机库中的
hardware_specifications.store
函数。 有关更多信息,请参阅 Python 客户机库参考 - 数据与人工智能通用核心 API:使用数据和人工智能通用核心 API 环境列表中的 "
POST /v2/hardware_specifications
创建硬件规范。 有关更多信息,请参阅 环境 API 参考。
需要硬件规范的部署类型
选择硬件规范可用于所有 批处理部署 类型。 对于 联机部署,您可以选择特定硬件规范 (如果要部署):
- Python 函数
- Tensorflow 模型
- 具有定制软件规范的模型
可用于部署资产的硬件配置
XS
: 1x4 = 1 vCPU 和 4 GB RAMS
: 2x8 = 2 vCPU 和 8 GB RAMM
: 4x16 = 4 vCPU 和 16 GB RAML
: 8x32 = 8 vCPU 和 32 GB RAMXL
: 16x64 = 16 vCPU 和 64 GB RAM
您可以使用 XS
配置来部署:
- Python 函数
- Python 脚本
- R 脚本
- 基于定制库和定制图像的模型
对于 Decision Optimization 部署,您可以使用以下硬件规范:
S
M
L
XL
GPU 推断的硬件规范
从Cloud Pak for Data 4.8.5 版开始,您可以在创建部署时,在 "x86
平台的用户界面上为 CUDA 软件规格选择 GPU 硬件规格。
对于 GPU 推断,请使用以下预定义硬件规范:
了解更多信息
父主题: 管理预测性部署