0 / 0
Go back to the English version of the documentation
生成式人工智能资产的计费详情
Last updated: 2024年12月05日
生成式人工智能资产的计费详情

了解如何使用资源单位 (RU)、小时费率或统一费率衡量生成式人工智能资产的使用量。

使用 "watsonx.ai运行时处理人工智能生成资产需要使用 "watsonx.ai。 IBM watsonx.ai概览

审查如何使用资源进行衡量的细节:

  • 由watsonx.ai 提供的用于测量基础模型推理活动的资源单位。
  • 使用watsonx.ai 导入和部署自定义基础模型的小时费率。
  • 按需在专用硬件上部署策划的基础模型的小时费率。
  • 文件文本提取按页统一收费。

基础模型的资源单位计量

有关支持的地基型号列表及其价格,请参阅支持的地基型号。 有关支持的编码器型号列表及其价格,请参阅支持的编码器型号

一个资源单位(RU)等于基础模型推理输入和输出中的 1000 个标记。 标记是文本的基本单位(通常为 4 个字符或0.75个单词),用于基础模型提示的输入或输出,或嵌入模型的输入。

IBM watsonx.ai提供的每个基础模型都会为输入和输出分配一个推理价格。 该价格是 RU 基准价格(00.0001 美元)的倍数。 例如,一个价格为 00.0006美元的模型的乘数是基本费率的 6 倍。

重要:根据计划,每秒向模型提交的推理请求数量是有限制的。 如果用户超过推理请求限制,系统会发出通知提供指导。

提示调整的基础模型与基础模型的价格相同。 有关调优基础模型的信息,请参阅Tuning Studio。 在Tuning Studio中调整模型需要消耗容量单位小时(CUH)。 有关详细信息,请参阅机器学习资产的计费详情

计算每个模型的资源单位费率

要计算基础模型推断的费用,请将当月消耗的代币总数除以 1000,然后四舍五入到最接近的 1000,得出 RU 总数。 将 RU 总数乘以型号价格,即可得出总使用费。 模型价格因模型而异,也可能因特定模型的输入或输出令牌而异。

基本公式如下

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

一个 RU 的基本价格为 00.0001 美元。 每个基础型号的价格都是基础价格的倍数。

按乘数计费等级

如果使用watsonx.aiAPI 监控模型使用情况,模型价格会按定价层级列出,如下所示:

表 1. 应用程序接口定价层级
模式定价层级 每单位价格(美元 乘数
基准费率
一级 $0.0006 6
二级 $0.0018 18
第三类 $0.0050 50
C1级 $0.0001 1
第五班 $0.00025 2.5
第 7 级 $0.016 160
第八班 $0.00015 1.5
九班 $0.00035 3.5
第十班 $0.0020 20
第 11 课 $0.000005 0.05
12 班 $0.0002 2
注:

某些型号,如 Mistral Large,有不按乘数分配的特殊定价。 定价按支持型号列出。

定制基础模型的按小时计费标准

部署自定义基础模型需要使用标准计划。

计费标准根据模型硬件配置而定,并适用于托管和推断模型。 收费从模型成功部署时开始,一直持续到模型被删除。

表 2. 自定义基础模型计费标准
配置大小 每小时计费标准(美元
$5.22
$10.40
$20.85
重要信息:每个账户最多可部署四个小型自定义基础模型、两个中型模型或一个大型模型。

有关为自定义基础模型选择配置的详细信息,请参阅计划部署自定义基础模型

按需部署模式的小时计费率

当您需要专供贵组织使用的托管解决方案时,可按需部署基础模型。 只有获准访问部署的同事才能推断基础模型。 专用部署意味着更快、更灵敏的交互,并允许使用更大的上下文窗口长度进行提示。 计费标准按模型设定,适用于托管和推断模型。 收费从模型部署时开始,一直持续到模型被删除。

注:按需部署基础模型需要使用标准计划。 该功能目前仅适用于达拉斯数据中心。

有关按需部署基础模型的详细信息(包括定价),请参阅 watsonx.ai提供的支持基础模型

文件文本提取每页费率

使用watsonx.aiREST API 的文档文本提取方法,将高度结构化并使用图表和表格来传达信息的 PDF 文件转换为 AI 模型友好的 JSON 文件格式。

账单按每处理一页的统一费率收取。 页面可以是一页文字(最多 1800 个字符)、一幅图像或一个 .tiff 框架。 账单费率取决于您的计划类型。

表 3. 文本提取定价
计划类型 每页价格(美元
基础版 $0.038
标准 $0.030

了解更多信息

父主题: watsonx.ai运行时计划

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more