0 / 0
Go back to the English version of the documentation
修复潜在匹配以提高数据质量 (IBM Match 360)
Last updated: 2024年12月05日
修复潜在匹配以提高数据质量 (IBM Match 360)

复审并评估实体数据中的潜在记录匹配项。 制定链接或取消链接决策,以提高数据质量并提高对实体数据的信心。

使用 IBM Cloud Pak for Data 和 IBM Match 360 服务的数据质量功能来识别、了解、升级、纠正和预防实体数据中的数据质量问题。

在本主题中:

准备工作

在开始生成潜在匹配任务并对其进行补救之前,数据工程师用户必须已完成以下任务:

查看资产数据质量和实体置信度

项目所有者和合作者可以查看其数据资产的数据质量信息。 数据质量信息汇总在一系列维度评分中,您可以从项目的资产数据质量选项卡访问这些维度评分。

有助于数据质量评估的一个维度是实体置信度。 仅针对已连接的 IBM Match 360 实体数据资产报告实体置信度维度。 实体置信度分数表示系统中 IBM Match 360 确信正确且完整的主数据实体的百分比。

您可以通过调整匹配算法或补救潜在的匹配问题来提高资产的实体置信度分数。

有关数据质量的更多信息,请参阅 数据资产的数据质量信息

如果资产的实体置信度分数较低,那么生成和补救某些潜在匹配任务可能会使数据受益。

要查看数据质量信息和实体置信度分数:

  1. 从 Cloud Pak for Data 导航菜单中,选择 项目 > 所有项目。 从 "项目" 页面中选择 IBM Match 360 项目。
  2. 单击项目的 资产 选项卡,然后选择要查看其数据质量分析的已连接主数据资产。
  3. 选择 数据质量 选项卡。 生成和显示数据质量报告可能需要一些时间。
  4. 当数据质量报告可用时,请查看实体置信度分数。
提示: 在数据专员完成大量补救任务后,返回到 "数据质量" 选项卡以查看资产的评分如何提高。

为潜在匹配问题生成任务

必须先生成一些潜在的匹配任务,然后才能查看和补救数据中匹配实体内的潜在问题。 您可以从完整数据集或一组搜索结果生成任务,以缩小任务范围。 例如,您可以选择将修复任务集中在特定地理区域上,以避免数据管理员的任务收件箱过多。

所需许可权
要创建和补救潜在的匹配任务,您必须是 IBM Match 360 服务的数据工程师或数据管理员用户组的成员。

要生成潜在的匹配修复任务,请执行以下操作:

  1. 从主数据导航菜单,单击搜索"搜索图标打开主数据搜索页面。

  2. (可选) 运行搜索以缩小数据范围。 有关搜索的更多信息,请参阅 浏览 IBM Match 360中的主数据实体和记录

  3. 单击 创建任务

  4. 定义补救任务创建的参数。

    • 定义是要为所有数据或当前搜索的结果 (如果适用) 创建任务。
    • 选择要包含在这些任务中的实体类型。
    • 定义在此操作期间要创建的任务数。
  5. 单击 创建任务 以开始生成补救任务。

当任务就绪时,这些任务将显示为已分配用户的任务收件箱中的 修复潜在匹配项 任务。 用户分配在工作流程配置中定义。

如果手动或通过匹配过程更新了已包含在生成的 修复潜在匹配项 任务中的实体,那么 Cloud Pak for Data 会自动失效并除去相应的任务。 如果在匹配更新后仍存在潜在的匹配问题,那么可以通过重复任务生成过程来重新创建任务。

完成用于补救潜在匹配项的任务

作为数据管理者用户,当您的任务收件箱中存在潜在的匹配问题时,您可以对这些问题进行索赔,并修复已识别的数据质量问题。

要补救潜在的匹配问题,请执行以下操作:

  1. 从 Cloud Pak for Data 导航菜单中,选择 监管 > 任务收件箱。 这样会打开任务收件箱,以显示已分配或已完成的任务。

  2. 检查收件箱中是否有任何 修复潜在匹配项 任务。

    单击过滤器图标 "过滤器图标,即可访问过滤器选项,用于缩小收件箱的范围。 例如,要仅显示修复任务: 在 " 任务类型" 下,选择 修复,然后单击 应用。 您还可以按到期日期或分配的日期对任务收件箱进行排序。

  3. 要开始处理任务,请将其打开,然后单击 声明任务。 当您声明任务时,系统会阻止其他用户处理该任务。

  4. 查看任务的摘要详细信息。

  5. 单击 修复问题 以开始比较任务所标识的记录。 这将打开一个图形视图,其中显示此潜在匹配任务中涉及的所有记录和实体的直观表示。 记录之间的潜在匹配表示为虚线。

  6. (可选) 单击每个记录以查看其详细信息。

  7. 在潜在匹配面板中,您将看到此任务中包含的每个潜在匹配决策的项。 单击每个项以查看详细信息。 将向您显示所涉及记录的并排比较,以帮助您做出决策。

    如果看到一条消息说 批量操作可用,那么系统确定可能可以做出适用于此任务中所有问题的批量决策 ( 链接取消链接)。 单击 预览 以查看在作出决策之前所作更改的外观的可视化。

  8. 单击 显示实体 以展开比较面板。

  9. 对于任务中的每个决策,您可以选择要执行的操作: 手动链接 (链接) ,手动取消链接 (取消链接) 或跳过问题 (跳过)。 如果可能,系统将提供智能推荐,为您提供每个推荐的置信度分数。

    在做出最终决策之前,您还可以单击 预览 以查看实体和记录结构的外观可视化。

    作出决定,然后单击 链接取消链接跳过以在模态中确认该决定。

    提示: 尚未将更改应用于系统中的数据。 单击 提交 以应用更改。
  10. 单击 提交 以应用更改并完成此任务。 如果单击 拒绝,那么不会进行任何更改。

  11. 从任务收件箱中,单击 已完成 以查看已完成的所有任务的列表,包括有关作为任务一部分完成的每个活动的详细信息。

了解更多信息

父主题: 浏览主数据

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more