您可以创建和管理数据质量定义,以定义对分析数据资产中的数据质量有用的逻辑。
如果您具有 必需许可权,那么可以通过以下方式管理数据质量定义:
您还可以使用 API 而不是用户界面来完成这些任务。 这些 API 的链接在 了解更多信息 部分中列出。
必需的许可权
要查看数据质量定义,必须在项目中至少具有 查看者 角色。
要创建,编辑或删除数据质量定义,您必须在项目中具有 管理数据质量资产 用户许可权 和 管理员 或 编辑者 角色。
创建数据质量定义
要创建数据质量定义:
打开一个项目,点击新资产 > 定义如何衡量数据质量。
定义详细信息:
- 指定数据质量定义的名称。
- 可选:提供描述。
- 可选: 选择数据质量维度以描述此资产中规则逻辑的主数据质量指标。 所选维度可用作报告类别,用于过滤或可视化所选数据。
定义规则逻辑。 您可以使用自由格式编辑器来构造规则逻辑。 在 规则表达式 字段中输入表达式。 有关可以使用的表达式的列表,请参阅 规则逻辑的构建块。 另请检查 样本规则表达式的集合。 这些样本演示如何组合规则逻辑的构建块。 您可以将提供的表达式复制到自己的数据质量定义中,并根据需要使用这些表达式或对其进行调整。
当表达式包含括在双引号中的字符串时,特殊注意事项适用,例如:
ucase(trim(var_first_name)) NOT contains "YOU'RE"
此类值被视为字符串字面值。 但是,如果希望将此类值视为变量,可以通过使用 IBM Knowledge Catalog API Replace project settings for data quality rules 将项目设置
allow_quoted_variables
更改为true
。作为在自由格式编辑器中编写表达式的替代方法,您可以使用块元素来构造规则逻辑:
从逻辑组中选择元素,例如 IF THEN。 可以使用 AND、OR 和 NOT 运算符来扩展规则逻辑。
选择 检查,选择要使用的检查类型,并将其连接到 IF 块。
从 变量和文字, 操作, 日期和时间, 常规, 数学或 字符串 组中选择所需的任意数量的条件,并将它们拖到 检查 逻辑中。
从检查组中选择一种或多种类型的检查,然后将其连接到 THEN 块。
从 变量和文字, 操作, 日期和时间, 常规, 数学或 字符串 组中选择所需的任意数量的条件,并将它们拖到 检查 逻辑中。
当您右键单击画布或单个块时,其他操作将变为可用。 例如,可以复制块或添加注释。
提示:始终在块部分中添加注释。 在规则表达式文本区域中输入或更新注释可能并非总是按预期工作。
您可以通过将块元素拖到废纸箱来删除该块元素或整个构造。
查看 规则表达式 字段中的规则逻辑。
单击 创建时,将检查表达式的语法。 如果有效,那么将创建数据质量定义。 现在,您可以从此定义创建数据质量规则。
发布数据质量定义
您可以通过将任何数据质量定义发布到可以将其添加到任意数量的项目的目录,使其在其他项目中可供复用。 在执行此操作之前,请确保数据质量定义的描述提供有意义的信息。 此类信息可帮助其他用户选择正确的数据质量定义以在其项目中使用。
要发布数据质量定义:
从资产列表中选择数据质量定义,然后单击 发布到目录。 或者,可以从资产的溢出菜单中选择 发布到目录 。
选择目录并填写资产属性。
如果目录中已存在资产重复项,那么可以指定在这种情况下应执行的操作。 您的选项由目录缺省设置确定。 有关重复资产处理的更多信息,请参阅 处理目录中的重复资产。
单击发布。 这会将资产添加到添加到目录中,并且您是这些资产的所有者。 分配的业务术语和标记随资产一起发布。 未发布已分配的监管规则。 您必须在发布定义后手动重新创建此类关系。
规则表达式和所选数据质量维度也将发布并在目录中的资产预览中可用。
如果为数据质量定义分配了术语,那么该术语的 " 相关内容 " 页面上的 数据质量定义 部分针对具有该关系的定义所在的每个容器都有一个条目。 这同样适用于与监管规则的关系。
将目录中的数据质量定义添加到项目时,分配的分类和可能定义的任何关系不会复制到项 目中。
编辑数据质量定义
您可以编辑数据质量定义以更新其名称,描述,所选数据质量维度,规则表达式或任何业务术语或监管规则分配。
要编辑数据质量定义,请打开资产,然后执行相应的操作:
- 单击要更改的属性旁边的编辑图标 "。
- 从资产名称旁边的溢出菜单中选择一个选项。 例如,可以选择 重命名 以更改资产名称。
请记住,对规则表达式的任何更改都会影响从此数据质量定义派生的所有规则。 要查看与该数据质量定义相关的规则(如果有),请单击信息图标 "。
删除数据质量定义
您可以通过下列其中一种方法来删除数据质量定义:
- 在项目中,选择数据质量定义,然后单击 删除。
- 打开数据质量定义,然后从数据质量定义名称旁边的溢出菜单中选择 删除 。
如果任何数据质量规则基于此数据质量定义,那么必须先删除这些规则,然后才能删除该定义。
了解更多信息
- 数据质量资产
- 规则逻辑的构建块
- 样本规则表达式
- 管理数据质量规则
- 处理目录中的重复资产
- IBM Knowledge Catalog API:创建数据质量定义
- IBM Knowledge Catalog API:验证数据质量定义表达式
- IBM Knowledge Catalog API:发布资产
- IBM Knowledge Catalog API:更新数据质量定义
- IBM Knowledge Catalog API:删除不再需要的数据质量定义
父主题: 管理数据质量