了解如何使用资源单位 (RU)、小时费率或统一费率衡量生成式人工智能资产的使用量。
使用 "watsonx.ai运行时处理人工智能生成资产需要使用 "watsonx.ai。 IBM watsonx.ai概览。
审查如何使用资源进行衡量的细节:
- watsonx.ai 提供的资源单元用于测量基础模型的推理活动。
- 使用watsonx.ai 导入和部署自定义基础模型的小时费率。
- 按需在专用硬件上部署策划的基础模型的小时费率。
- 文件文本提取按页统一收费。
资源单位用于测量以下资源:
- 用于推断基础模型以生成文本或文本嵌入的标记。
- 时间序列基础模型用于预测未来值的数据点。
推理基础模型的资源单位计量
有关支持的地基型号列表及其价格,请参阅支持的地基型号。 有关支持的编码器型号列表及其价格,请参阅支持的编码器型号。
在测量基础模型推断时,资源单元(RU)等于基础模型输入和输出中的1000个标记。 标记是文本的基本单位(通常为 4 个字符或0.75个单词),用于基础模型提示的输入或输出,或嵌入模型的输入。
IBM watsonx.ai提供的每个基础模型都会为输入和输出分配一个推理价格。 该价格是 RU 基准价格(00.0001 美元)的倍数。 例如,一个价格为 00.0006美元的模型的乘数是基本费率的 6 倍。
提示调整的基础模型与基础模型的价格相同。 有关调优基础模型的信息,请参阅Tuning Studio。 在Tuning Studio中调整模型需要消耗容量单位小时(CUH)。 有关详细信息,请参阅机器学习资产的计费详情。
用于推断时间序列基础模型的资源单位计量
在测量基础模型预测时,资源单元(RU)等于基础模型输入和输出中的1000个数据点。 数据点是以一个或多个数字表示的输入和输出内容的单位。
按乘数计费等级
如果使用watsonx.aiAPI 监控模型使用情况,模型价格会按定价层级列出,如下所示:
模式定价层级 | 资源类型 | 每单位价格(美元 | 乘数 基准费率 |
---|---|---|---|
一级 | 令牌 | $0.0006 | 6 |
二级 | 令牌 | $0.0018 | 18 |
第三类 | 令牌 | $0.0050 | 50 |
C1级 | 令牌 | $0.0001 | 1 |
第五班 | 令牌 | $0.00025 | 2.5 |
第 7 级 | 令牌 | $0.016 | 160 |
第八班 | 令牌 | $0.00015 | 1.5 |
九班 | 令牌 | $0.00035 | 3.5 |
第十班 | 令牌 | $0.0020 | 20 |
第 11 课 | 令牌 | $0.000005 | 0.05 |
12 班 | 令牌 | $0.0002 | 2 |
13级 | 令牌 | $0.00071 | 7.1 |
14级 | 数据点 | $0.00013 | 1.3 |
15级 | 数据点 | $0.00038 | 3.8 |
某些型号,如 Mistral Large,有不按乘数分配的特殊定价。 定价按支持型号列出。
计算每款车型的代币资源单位费率
要计算基础模型推断的费用,请将当月消耗的代币总数除以 1000,然后四舍五入到最接近的 1000,得出 RU 总数。 将 RU 总数乘以型号价格,即可得出总使用费。 模型价格因模型而异,也可能因特定模型的输入或输出令牌而异。
基本公式如下
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
一个 RU 的基本价格为 00.0001 美元。 每个基础型号的价格都是基础价格的倍数。
计算每款车型的数据点资源单位费率
使用时间序列基础模型计算预测费用时,请使用以下公式:
- 输入计算:
context length x number of series x number of channels
- 输出计算:
prediction length x number of series x number of channels
这些方程使用以下参数:
- 背景长度是指时间序列基础模型用于预测的历史数据点数量。
- 系列是指一段时间内按顺序进行的观察。 例如,在比较多家公司的股票价格时,每家公司观察到的股票价格历史都是单独的序列。
- 通道是指在时间序列数据集中测量的特定特征或变量。
- 预测长度是指模型预测的未来数据点数量。
资源类型 | 模式定价层级 | 每RU美元价格 |
---|---|---|
输入数据点 | 14级 | $0.00013 |
输出数据点 | 15级 | $0.00038 |
以下示例说明如何计算具有以下参数的时间序列预测请求的成本:
参数 | 示例数量 |
---|---|
上下文长度( granite-ttm-1536-96-r2 模型) | 1536 |
渠道 | 10 |
序列 | 1,000 小时 |
预测长度 | 96 |
输入数据点总数:1536万(上下文长度为1536,10个通道,用于1000系列)
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
总输出数据点:960,000(预测96个时间点,10个通道,1,000系列)
960,000 / 1,000 = 960 x 0.00038 = 0.3648
时间序列预测请求的总价格: 2.36 (输入成本: 1.9968 ;输出成本: 0.3648 )
1.9968 + 0.3648 = 2.3616
定制基础模型的按小时计费标准
部署自定义基础模型需要使用标准计划。
计费标准根据模型硬件配置而定,并适用于托管和推断模型。 收费从模型成功部署时开始,一直持续到模型被删除。
配置大小 | 每小时计费标准(美元 |
---|---|
小 | $5.22 |
中 | $10.40 |
大 | $20.85 |
有关为自定义基础模型选择配置的详细信息,请参阅计划部署自定义基础模型。
按需部署模式的小时计费率
当您需要专供贵组织使用的托管解决方案时,可按需部署基础模型。 只有获准访问部署的同事才能推断基础模型。 专用部署意味着更快、更灵敏的交互,并允许使用更大的上下文窗口长度进行提示。 计费标准按模型设定,适用于托管和推断模型。 收费从模型部署时开始,一直持续到模型被删除。
如需了解按需部署基础模型的详细信息(包括定价),请访问 watsonx.ai 中的支持的基础模型。
文件文本提取每页费率
使用watsonx.aiREST API 的文档文本提取方法,将高度结构化并使用图表和表格来传达信息的 PDF 文件转换为 AI 模型友好的 JSON 文件格式。
账单按每处理一页的统一费率收取。 页面可以是一页文字(最多 1800 个字符)、一幅图像或一个 .tiff 框架。 账单费率取决于您的计划类型。
计划类型 | 每页价格(美元 |
---|---|
基础版 | $0.038 |
标准 | $0.030 |
了解更多信息
- 有关机器学习资产定价的详细信息,请参阅机器学习资产计费标准。
- 有关跟踪计算资源分配和消耗的详细信息,请参阅运行时使用情况。
- 有关各车型的详细信息,请参阅支持的基金会车型。
- 有关各车型的区域支持详情,请参阅基础车型的区域可用性。
父主题: watsonx.ai运行时计划