生成式人工智能资产的计费详情 | IBM Cloud Pak for Data as a Service

Go back to the English version of the documentation

生成式人工智能资产的计费详情

Last updated: 2025年2月14日

生成式人工智能资产的计费详情

了解如何使用资源单位 (RU)、小时费率或统一费率衡量生成式人工智能资产的使用量。

使用 "watsonx.ai运行时处理人工智能生成资产需要使用 "watsonx.ai。 IBM watsonx.ai概览。

审查如何使用资源进行衡量的细节：

资源单位用于测量以下资源：

推理基础模型的资源单位计量

有关支持的地基型号列表及其价格，请参阅支持的地基型号。有关支持的编码器型号列表及其价格，请参阅支持的编码器型号。

在测量基础模型推断时，资源单元（RU）等于基础模型输入和输出中的1000个标记。标记是文本的基本单位（通常为 4 个字符或0.75个单词），用于基础模型提示的输入或输出，或嵌入模型的输入。

IBM watsonx.ai提供的每个基础模型都会为输入和输出分配一个推理价格。该价格是 RU 基准价格（00.0001 美元）的倍数。例如，一个价格为 00.0006美元的模型的乘数是基本费率的 6 倍。

重要：根据计划，每秒向模型提交的推理请求数量是有限制的。如果用户超过推理请求限制，系统会发出通知提供指导。

提示调整的基础模型与基础模型的价格相同。有关调优基础模型的信息，请参阅Tuning Studio。在Tuning Studio中调整模型需要消耗容量单位小时（CUH）。有关详细信息，请参阅机器学习资产的计费详情。

在测量基础模型预测时，资源单元（RU）等于基础模型输入和输出中的1000个数据点。数据点是以一个或多个数字表示的输入和输出内容的单位。

如果使用watsonx.aiAPI 监控模型使用情况，模型价格会按定价层级列出，如下所示：

表 1. 应用程序接口定价层级
模式定价层级	资源类型	每单位价格（美元	乘数基准费率
一级	令牌	$0.0006	6
二级	令牌	$0.0018	18
第三类	令牌	$0.0050	50
C1级	令牌	$0.0001	1
第五班	令牌	$0.00025	2.5
第 7 级	令牌	$0.016	160
第八班	令牌	$0.00015	1.5
九班	令牌	$0.00035	3.5
第十班	令牌	$0.0020	20
第 11 课	令牌	$0.000005	0.05
12 班	令牌	$0.0002	2
13级	令牌	$0.00071	7.1
14级	数据点	$0.00013	1.3
15级	数据点	$0.00038	3.8

注：

某些型号，如 Mistral Large，有不按乘数分配的特殊定价。定价按支持型号列出。

要计算基础模型推断的费用，请将当月消耗的代币总数除以 1000，然后四舍五入到最接近的 1000，得出 RU 总数。将 RU 总数乘以型号价格，即可得出总使用费。模型价格因模型而异，也可能因特定模型的输入或输出令牌而异。

基本公式如下

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

一个 RU 的基本价格为 00.0001 美元。每个基础型号的价格都是基础价格的倍数。

使用时间序列基础模型计算预测费用时，请使用以下公式：

这些方程使用以下参数：

数据点定价
资源类型	模式定价层级	每RU美元价格
输入数据点	14级	$0.00013
输出数据点	15级	$0.00038

以下示例说明如何计算具有以下参数的时间序列预测请求的成本：

输入数据点总数：1536万（上下文长度为1536，10个通道，用于1000系列）
```
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
```
总输出数据点：960,000（预测96个时间点，10个通道，1,000系列）
```
960,000 / 1,000 = 960 x 0.00038 = 0.3648
```
时间序列预测请求的总价格： 2.36 （输入成本： 1.9968 ；输出成本： 0.3648 ）
```
1.9968 + 0.3648 = 2.3616
```