您可以创建和管理数据质量规则,以评估项目中数据的质量。
如果您具有 必需许可权,那么可以通过以下方式管理数据质量规则:
您还可以使用 API 而不是用户界面来完成这些任务。 这些 API 的链接在 了解更多信息 部分中列出。
- 必需的服务
- IBM Knowledge Catalog
- DataStage或DataStage as a Service Anywhere'
使用DataStage,您可以在支持的区域运行数据质量规则。 借助DataStage as a Service Anywhere,您可以使用远程引擎在IBM Cloud之外运行数据质量规则。 有关设置远程引擎的详细信息,请参阅DataStage as a Service Anywhere文档。
必需的许可权
要查看数据质量规则,您必须在项目中至少具有 查看者 角色。
要创建,编辑或删除数据质量规则,您必须具有项目中的 管理数据质量资产 用户许可权 和 管理员 或 编辑者 角色。
规则执行的项目设置
项目级别设置确定数据质量规则执行的某些方面,例如,是否在等式检查中忽略字符串值中的尾部空格。 这些设置适用于给定项目的所有数据质量规则。 您可以使用 IBM Knowledge Catalog API 获取数据质量规则的项目设置 和 替换数据质量规则的项目设置 检查或更新每个项目的这些设置。
创建数据质量规则
您可以创建不同类型的数据质量规则:
编辑数据质量规则
您可以编辑数据质量规则以更新其描述,所选数据质量维度,任何业务术语分配或规则配置。 您还可以管理相关项的列表。
要编辑数据质量规则,请打开资产并执行相应的操作:
要更新描述或数据质量维度,请单击属性旁边的编辑图标 "。
要管理业务术语,请转至资产的 监管工件 部分,并根据需要添加或除去术语。
要分配或删除监管规则,请转至资产的 监管工件 部分,并根据需要添加或除去监管规则。
要更新规则配置,请单击 编辑规则。 编辑规则配置时,还可以更改构建规则的方式: 从使用数据质量定义到使用 SQL 语句,反之亦然。 但是,执行此操作时,将废弃所有现有规则配置,并且基本上必须从头开始。
您还可以更改输出类型。 根据您的新选择,将重置或覆盖任何已配置的输出设置。 在更改之前写入的规则输出保持不变。
对于直接绑定数据的数据质量规则, 验证 与每个绑定列的数据质量以及与包含该列的资产的数据质量关系将添加到 相关项 部分。 您可以手动将具有此类型关系的资产和列添加到所有类型的数据质量规则。 将资产和列添加到具有外部管理的绑定的数据质量规则或具有此关系的基于 SQL 的数据质量规则时,这些类型的规则将对相应资产或列的数据质量评分作出贡献。 将针对与 验证 关系类型的数据质量链接的所有资产和列报告规则生成的评分和问题。
查看数据质量规则时,可以单击信息图标 "查看更多详细信息,如输出设置或相关资产。
删除数据质量规则
您可以通过下列其中一种方法来删除数据质量规则:
- 在项目中,选择数据质量规则,然后单击 删除。
- 打开数据质量规则,然后从数据质量规则名称旁边的溢出菜单中选择 删除 。
删除数据质量规则时,还会从项目中删除其运行历史记录,任何关联的 DataStage 流和作业。 将保留项目和数据库中的输出表。 将除去此数据质量规则返回的问题,并重新计算数据质量和维评分。
了解更多信息
后续步骤
父主题: 管理数据质量