0 / 0
Go back to the English version of the documentation
生成式人工智能资产的计费详情
Last updated: 2025年2月14日
生成式人工智能资产的计费详情

了解如何使用资源单位 (RU)、小时费率或统一费率衡量生成式人工智能资产的使用量。

使用 "watsonx.ai运行时处理人工智能生成资产需要使用 "watsonx.ai。 IBM watsonx.ai概览

审查如何使用资源进行衡量的细节:

  • watsonx.ai 提供的资源单元用于测量基础模型的推理活动。
  • 使用watsonx.ai 导入和部署自定义基础模型的小时费率。
  • 按需在专用硬件上部署策划的基础模型的小时费率。
  • 文件文本提取按页统一收费。

资源单位用于测量以下资源:

  • 用于推断基础模型以生成文本或文本嵌入的标记。
  • 时间序列基础模型用于预测未来值的数据点。

推理基础模型的资源单位计量

有关支持的地基型号列表及其价格,请参阅支持的地基型号。 有关支持的编码器型号列表及其价格,请参阅支持的编码器型号

在测量基础模型推断时,资源单元(RU)等于基础模型输入和输出中的1000个标记。 标记是文本的基本单位(通常为 4 个字符或0.75个单词),用于基础模型提示的输入或输出,或嵌入模型的输入。

IBM watsonx.ai提供的每个基础模型都会为输入和输出分配一个推理价格。 该价格是 RU 基准价格(00.0001 美元)的倍数。 例如,一个价格为 00.0006美元的模型的乘数是基本费率的 6 倍。

重要:根据计划,每秒向模型提交的推理请求数量是有限制的。 如果用户超过推理请求限制,系统会发出通知提供指导。

提示调整的基础模型与基础模型的价格相同。 有关调优基础模型的信息,请参阅Tuning Studio。 在Tuning Studio中调整模型需要消耗容量单位小时(CUH)。 有关详细信息,请参阅机器学习资产的计费详情

用于推断时间序列基础模型的资源单位计量

在测量基础模型预测时,资源单元(RU)等于基础模型输入和输出中的1000个数据点。 数据点是以一个或多个数字表示的输入和输出内容的单位。

按乘数计费等级

如果使用watsonx.aiAPI 监控模型使用情况,模型价格会按定价层级列出,如下所示:

表 1. 应用程序接口定价层级
模式定价层级 资源类型 每单位价格(美元 乘数
基准费率
一级 令牌 $0.0006 6
二级 令牌 $0.0018 18
第三类 令牌 $0.0050 50
C1级 令牌 $0.0001 1
第五班 令牌 $0.00025 2.5
第 7 级 令牌 $0.016 160
第八班 令牌 $0.00015 1.5
九班 令牌 $0.00035 3.5
第十班 令牌 $0.0020 20
第 11 课 令牌 $0.000005 0.05
12 班 令牌 $0.0002 2
13级 令牌 $0.00071 7.1
14级 数据点 $0.00013 1.3
15级 数据点 $0.00038 3.8
注:

某些型号,如 Mistral Large,有不按乘数分配的特殊定价。 定价按支持型号列出。

计算每款车型的代币资源单位费率

要计算基础模型推断的费用,请将当月消耗的代币总数除以 1000,然后四舍五入到最接近的 1000,得出 RU 总数。 将 RU 总数乘以型号价格,即可得出总使用费。 模型价格因模型而异,也可能因特定模型的输入或输出令牌而异。

基本公式如下

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

一个 RU 的基本价格为 00.0001 美元。 每个基础型号的价格都是基础价格的倍数。

计算每款车型的数据点资源单位费率

使用时间序列基础模型计算预测费用时,请使用以下公式:

  • 输入计算: context length x number of series x number of channels
  • 输出计算: prediction length x number of series x number of channels

这些方程使用以下参数:

  • 背景长度是指时间序列基础模型用于预测的历史数据点数量。
  • 系列是指一段时间内按顺序进行的观察。 例如,在比较多家公司的股票价格时,每家公司观察到的股票价格历史都是单独的序列。
  • 通道是指在时间序列数据集中测量的特定特征或变量。
  • 预测长度是指模型预测的未来数据点数量。
数据点定价
资源类型 模式定价层级 每RU美元价格
输入数据点 14级 $0.00013
输出数据点 15级 $0.00038

以下示例说明如何计算具有以下参数的时间序列预测请求的成本:

用于计算数据点使用率的参数
参数 示例数量
上下文长度( granite-ttm-1536-96-r2 模型) 1536
渠道 10
序列 1,000 小时
预测长度 96
  • 输入数据点总数:1536万(上下文长度为1536,10个通道,用于1000系列)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • 总输出数据点:960,000(预测96个时间点,10个通道,1,000系列)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • 时间序列预测请求的总价格: 2.36 (输入成本: 1.9968 ;输出成本: 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

定制基础模型的按小时计费标准

部署自定义基础模型需要使用标准计划。

计费标准根据模型硬件配置而定,并适用于托管和推断模型。 收费从模型成功部署时开始,一直持续到模型被删除。

自定义基础模型计费标准
配置大小 每小时计费标准(美元
$5.22
$10.40
$20.85
重要信息:每个账户最多可部署四个小型自定义基础模型、两个中型模型或一个大型模型。

有关为自定义基础模型选择配置的详细信息,请参阅计划部署自定义基础模型

按需部署模式的小时计费率

当您需要专供贵组织使用的托管解决方案时,可按需部署基础模型。 只有获准访问部署的同事才能推断基础模型。 专用部署意味着更快、更灵敏的交互,并允许使用更大的上下文窗口长度进行提示。 计费标准按模型设定,适用于托管和推断模型。 收费从模型部署时开始,一直持续到模型被删除。

注:按需部署基础模型需要使用标准计划。

如需了解按需部署基础模型的详细信息(包括定价),请访问 watsonx.ai 中的支持的基础模型

文件文本提取每页费率

使用watsonx.aiREST API 的文档文本提取方法,将高度结构化并使用图表和表格来传达信息的 PDF 文件转换为 AI 模型友好的 JSON 文件格式。

账单按每处理一页的统一费率收取。 页面可以是一页文字(最多 1800 个字符)、一幅图像或一个 .tiff 框架。 账单费率取决于您的计划类型。

文本提取定价
计划类型 每页价格(美元
基础版 $0.038
标准 $0.030

了解更多信息

父主题: watsonx.ai运行时计划