Go back to the English version of the documentation数据质量维
数据质量维
Last updated: 2025年2月21日
数据质量维度描述了数据的可测量特性,有助于定义数据质量要求。 使用数据质量维度来确定数据质量评估的预期结果,无论是初始评估还是持续监视。
您希望数据处于的状态通常可以定义为 适合使用, 无缺陷, 对应于规范或 满足期望和需求。 在度量数据质量时,将数据的实际状态与此所需状态进行比较。 对于业务流程很重要的标准,期望和需求表示为数据的特征或维度。
Data Management 协会 (DAMA) 国际发表了一篇论文,描述了 6 数据质量的核心维度:
维度 | 描述 | 用于识别与此维度关联的问题的预定义数据质量检查 |
---|---|---|
准确性 | 数据值尽可能接近实际值。 | 无。 |
完整性 | 存在所有必需的数据值。 | 意外缺失值 |
一致性 | 列中的数据值符合规则。 | 大写不一致 缺失值的不一致表示 可疑值 |
即时性 | 数据表示来自所需时间点的实际情况。 | 无。 |
唯一性 | 相异值仅出现一次。 | 意外的重复值 |
有效性 | 数据符合其定义的格式,类型或范围。 | 数据类违例 数据类型违例 格式化违例 值超出范围 |
您可以使用 IBM Knowledge Catalog API 创建数据质量维度 创建自己的数据质量维度。
您希望数据处于的状态通常可以定义为 适合使用, 无缺陷, 对应于规范或 满足期望和需求。 在度量数据质量时,将数据的实际状态与此所需状态进行比较。 对于业务流程很重要的标准,期望和需求表示为数据的特征或维度。
Data Management 协会 (DAMA) 国际发布了一份文件,描述了数据质量的六个核心维度: 准确性、 完整性、 一致性、 及时性、 唯一性和有效性
此外, IBM Knowledge Catalog 还提供了维度同质性。
所有这些维度都可以通过运行数据质量检查(作为元数据丰富的一部分)或运行单个数据质量规则来评估。
下表描述了数据质量维度,并列出了元数据丰富化中的数据质量检查,这些检查可以识别与特定维度相关的问题:
维度 | 描述 | 数据质量检查类型 |
---|---|---|
准确性 | 数据值尽可能接近实际值。 | 无。 |
完整性 | 存在所有必需的数据值。 | 完整性检查 |
一致性 | 列中的数据值符合规则。 | 大写检查 缺失值表示检查 参照完整性检查 ( IBM Knowledge Catalog Premium ) 疑似值检查 |
同质性(M) | 数据长期保持相似且稳定。 | 历史稳定性 ( IBM Knowledge Catalog Premium ) |
即时性 | 数据表示来自所需时间点的实际情况。 | 无。 |
唯一性 | 相异值仅出现一次。 | 唯一性检查 |
有效性 | 数据符合其定义的格式,类型或范围。 | 数据类检查 数据类型检查 格式检查 长度检查 可能的值检查 范围检查 正则表达式检查 |
了解更多信息
- 数据质量分析结果
- 预定义的数据质量检查
- 配置主数据工作流程
- IBM Knowledge Catalog API:列出所有数据质量维度
- IBM Knowledge Catalog API:创建数据质量维度
父主题: 管理数据质量