了解如何使用资源单位 (RU)、小时费率或统一费率衡量生成式人工智能资产的使用量。
使用 "watsonx.ai运行时处理人工智能生成资产需要使用 "watsonx.ai。 IBM watsonx.ai概览。
审查如何使用资源进行衡量的细节:
- 由watsonx.ai 提供的用于测量基础模型推理活动的资源单位。
- 使用watsonx.ai 导入和部署自定义基础模型的小时费率。
- 按需在专用硬件上部署策划的基础模型的小时费率。
- 文件文本提取按页统一收费。
基础模型的资源单位计量
有关支持的地基型号列表及其价格,请参阅支持的地基型号。 有关支持的编码器型号列表及其价格,请参阅支持的编码器型号。
一个资源单位(RU)等于基础模型推理输入和输出中的 1000 个标记。 标记是文本的基本单位(通常为 4 个字符或0.75个单词),用于基础模型提示的输入或输出,或嵌入模型的输入。
IBM watsonx.ai提供的每个基础模型都会为输入和输出分配一个推理价格。 该价格是 RU 基准价格(00.0001 美元)的倍数。 例如,一个价格为 00.0006美元的模型的乘数是基本费率的 6 倍。
提示调整的基础模型与基础模型的价格相同。 有关调优基础模型的信息,请参阅Tuning Studio。 在Tuning Studio中调整模型需要消耗容量单位小时(CUH)。 有关详细信息,请参阅机器学习资产的计费详情。
计算每个模型的资源单位费率
要计算基础模型推断的费用,请将当月消耗的代币总数除以 1000,然后四舍五入到最接近的 1000,得出 RU 总数。 将 RU 总数乘以型号价格,即可得出总使用费。 模型价格因模型而异,也可能因特定模型的输入或输出令牌而异。
基本公式如下
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
一个 RU 的基本价格为 00.0001 美元。 每个基础型号的价格都是基础价格的倍数。
按乘数计费等级
如果使用watsonx.aiAPI 监控模型使用情况,模型价格会按定价层级列出,如下所示:
模式定价层级 | 每单位价格(美元 | 乘数 基准费率 |
---|---|---|
一级 | $0.0006 | 6 |
二级 | $0.0018 | 18 |
第三类 | $0.0050 | 50 |
C1级 | $0.0001 | 1 |
第五班 | $0.00025 | 2.5 |
第 7 级 | $0.016 | 160 |
第八班 | $0.00015 | 1.5 |
九班 | $0.00035 | 3.5 |
第十班 | $0.0020 | 20 |
第 11 课 | $0.000005 | 0.05 |
12 班 | $0.0002 | 2 |
某些型号,如 Mistral Large,有不按乘数分配的特殊定价。 定价按支持型号列出。
定制基础模型的按小时计费标准
部署自定义基础模型需要使用标准计划。
计费标准根据模型硬件配置而定,并适用于托管和推断模型。 收费从模型成功部署时开始,一直持续到模型被删除。
配置大小 | 每小时计费标准(美元 |
---|---|
小 | $5.22 |
中 | $10.40 |
大 | $20.85 |
有关为自定义基础模型选择配置的详细信息,请参阅计划部署自定义基础模型。
按需部署模式的小时计费率
当您需要专供贵组织使用的托管解决方案时,可按需部署基础模型。 只有获准访问部署的同事才能推断基础模型。 专用部署意味着更快、更灵敏的交互,并允许使用更大的上下文窗口长度进行提示。 计费标准按模型设定,适用于托管和推断模型。 收费从模型部署时开始,一直持续到模型被删除。
有关按需部署基础模型的详细信息(包括定价),请参阅 watsonx.ai提供的支持基础模型。
文件文本提取每页费率
使用watsonx.aiREST API 的文档文本提取方法,将高度结构化并使用图表和表格来传达信息的 PDF 文件转换为 AI 模型友好的 JSON 文件格式。
账单按每处理一页的统一费率收取。 页面可以是一页文字(最多 1800 个字符)、一幅图像或一个 .tiff 框架。 账单费率取决于您的计划类型。
计划类型 | 每页价格(美元 |
---|---|
基础版 | $0.038 |
标准 | $0.030 |
了解更多信息
- 有关机器学习资产定价的详细信息,请参阅机器学习资产计费标准。
- 有关跟踪计算资源分配和消耗的更多信息,请参阅运行时使用。
- 有关每种型号的详细信息,请参阅支持的地基型号。
- 有关各型号的地区支持信息,请参阅基金会型号的地区可用性。
父主题: watsonx.ai运行时计划