在运行作业和大多数工具时,使用项目中的计算资源。 可为作业的运行时选择计算资源,具体取决于工具。
计算资源称为环境模板或硬件和软件规范。 通常,较大型硬件配置的计算资源会导致更高的使用成本。 项目中的许多工具都使用watsonx.aiStudio 服务来获取计算资源,但也有一些工具使用其他服务。 每个服务单独对计算使用情况进行跟踪和计费。
以下工具提供了多个用于配置运行时的选项,您必须从中进行选择:
- 笔记本编辑器
- Data Refinery
- SPSS Modeler
- DataStage 流程编辑器
- AutoAI
- 决策优化试验 (Decision Optimization experiment)
- RStudio IDE
以下工具具有一项自动分配的运行时配置:
以下工具不消耗计算资源:
- Metadata import
- 主数据配置
对数据资产进行概要分析
对项目或目录中的数据资产进行概要分析每小时使用 IBM Knowledge Catalog中的 6 CUH ,每个概要分析会话的最小数量为 0.96 CUH。 概要分析需要 IBM Knowledge Catalog 服务。
用于概要分析的运行时不会显示在项目的 管理 选项卡的 " 资源使用情况 " 页面上。 无法跟踪用于概要分析的计算使用情况。
元数据扩充
元数据扩充需要 IBM Knowledge Catalog 服务。 元数据扩充作业使用的 IBM Knowledge Catalog 中每小时的 CUH 量取决于您选择的扩充目标。
元数据扩充目标 | 每小时容量单位 (CUH) |
---|---|
概要分析数据 | 6 |
对数据进行概要分析并分配术语 | 8 |
运行元数据扩充时,将启动一个或多个作业。 每个作业最多处理 200 个表。 一次扩充超过 200 个表时,将启动多个作业。 例如,如果对 500 个表运行元数据扩充,那么将启动三个作业。 针对每个元数据扩充作业计费的最小 CUH 数量为 0.96 CUH。
使用 扩展元数据 选项或语义术语分配进行元数据扩充的作业限制为每个作业 10 个表。
元数据扩充所使用的 CUH 数量取决于表数以及表中的列数。 其他因素,如数据的结构,也会影响消耗的 CUH 量。 例如:
- 用于对具有 500 列的 500 个表的数据进行概要分析的三个作业可能总共使用大约 24 个 CUH。
- 用于对具有 500 列的 500 个表的数据进行概要分析和分配术语的三个作业可能总共耗用大约 30 个 CUH。
元数据丰富的运行时间不会出现在项目 "管理 "选项卡的 "资源使用"页面上。 无法跟踪元数据扩充的计算使用情况。
数据质量规则
数据质量规则作业作为具有缺省 DataStage PX S 环境的 DataStage 流运行,该环境每小时使用 1 CUH ,最少 1 分钟的 CUH。 数据质量规则需要 IBM Knowledge Catalog 和 DataStage 服务。
数据质量规则的运行时在项目的 管理 选项卡的 资源使用情况 页面上显示为 DataStage 流。
了解更多信息
父主题: 项目