0 / 0
Go back to the English version of the documentation
匹配数据以创建主数据实体 (IBM Match 360)
Last updated: 2024年11月26日
匹配数据以创建主数据实体 (IBM Match 360)

对数据运行匹配以让 IBM Match 360 确定是否可以将记录收集到主数据实体中。 每个主数据实体都包含一个或多个发现为匹配的记录。

所需许可权
要在主数据实例中配置和运行匹配,您必须是 IBM Match 360 服务的 DataEngineer 用户组的成员。

对数据运行匹配有两个常见原因:

  • 对于 记录去重和实体解析,匹配过程会分析数据以确定数据中是否存在任何重复记录。 可疑重复记录将合并到主数据实体中,以建立单个可信的全方位数据视图。
  • 要创建其他类型的 实体关联,匹配过程会分析数据以将记录收集到表示不同类型分组 (例如家庭或家庭) 的实体中。

有关匹配算法以及它们如何工作以匹配数据和创建实体的更多信息,请参阅 IBM Match 360 匹配算法

准备运行匹配

在运行匹配算法之前,请确保将数据模型和资产发布到 IBM Match 360 with Watson 服务。 有关更多信息,请参阅 添加数据并将其映射到数据模型

数据模型中定义的每个实体类型都有自己的单独匹配算法来创建该类型的实体。 例如, "人员" 记录类型可以具有多个实体类型,例如 "人员" 和 "家庭"。

  • 人员实体类型可用于重复数据删除和人员记录数据的实体解析。
  • 可以使用 "家庭" 实体类型来创建所有属于同一家庭的人员记录的关联。

设置匹配算法

要设置匹配算法:

  1. 从主数据导航菜单中,单击匹配设置"比赛设置图标

  2. 选择要配置其匹配算法的实体类型。 实体类型列表来自数据模型。

    此列表可能包含尚未发布到系统中的实体类型。 在这种情况下,匹配将无法启动。 始终确保在进行任何更改 (例如,添加新实体类型) 后发布数据模型。

  3. 转到匹配设置选项卡。

  4. 选择侧边栏中的属性选择,以选择用于匹配该实体类型中记录的属性。 首次打开此页面时,IBM Match 360服务会自动从您的数据模型中生成一些建议属性,以用于匹配。

  5. 复查匹配属性的列表。 这些属性将用作比较的基础,以匹配记录和创建主数据实体。 要在列表中添加或除去属性,请单击 编辑属性 ,然后根据需要选择或清除属性及其组件字段。

    选择匹配属性时,请使用匹配强度指示器来查看更改对匹配算法的影响程度的估算。

    如果已将任何定制属性添加到数据模型,那么缺省情况下不会选择这些属性以进行匹配。 如果要在匹配中使用定制属性类型,那么必须选择该属性类型,然后指定要考虑其哪些字段。 如果未指定任何字段,那么匹配的算法无法使用该属性。

    对于预定义 (非定制) 属性类型,如果未指定要考虑的字段,那么匹配算法将使用一组缺省字段。

  6. 当您对匹配的属性感到满意时,请单击 保存

选择要考虑进行匹配的记录

(可选) 您可以配置用于定义 IBM Match 360 选择哪些记录以进行匹配的条件。

缺省情况下,与所选实体类型关联的所有记录都可以参与匹配。 要缩小可供匹配的记录的范围,可以指定包含或排除具有特定属性值的记录的过滤条件。

要定义选择哪些记录进行匹配,请执行以下操作:

  1. 从主数据导航菜单中,单击匹配设置"比赛设置图标

  2. 选择要配置其匹配算法的实体类型。

  3. 在侧边栏中选择 记录选择 以访问记录选择设置。

  4. 如果要对此实体类型启用记录选择过滤器,请单击 启用记录选择

    要稍后禁用记录选择过滤器,请选择 禁用记录选择

  5. 定义记录选择条件:

    a. 单击 +,然后选择要考虑的属性。

    b. 单击 +,然后选择要为其选择的相应属性值。

    c. 重复这些步骤以添加条件。

    定义条件后, 操作 设置变为可用。

  6. 定义与条件关联的操作。 单击 +,然后选择 用于匹配不用于匹配

    • 如果选择 用于匹配,那么只有满足条件的记录才能够参与此实体类型的匹配。
    • 如果选择 不用于匹配,那么满足条件的任何记录都无法参与此实体类型的匹配。
注: 如果主数据包含手动链接规则,那么某些手动记录链接可能会因某些记录选择条件而失效。 例如,如果记录选择条件仅允许特定记录源中的记录,那么它将排除所有其他源中的记录。 在此情况下,包含来自其他源的记录的任何手动链接规则都将失效。 将自动删除无效规则。

匹配数据并查看结果

要对记录数据运行匹配以创建主数据实体:

  1. 从主数据导航菜单中,单击匹配设置"比赛设置图标

  2. 选择要配置其匹配算法的实体类型。

  3. 点击操作栏中的运行匹配图标 "运行匹配图标

    匹配过程需要一段时间才能完成。 此过程会在后台运行,因此您可以继续工作。 完成后将通知您。

    如果匹配过程在完成之前就结束了,可能是由于失败,也可能是由于你取消了该过程,那么下一次运行匹配时,系统会提示你选择从停止的阶段恢复匹配,还是从头开始重新启动该过程。 如果对正在匹配的数据进行了更改,请选择 重新开始匹配。 否则,请选择 恢复匹配,跳过已成功完成的匹配阶段,以节省时间。

匹配完成时,转至匹配结果选项卡以查看包含统计信息和可视化内容的仪表板,它会提供有关您的主数据的洞察。

管理匹配结果
匹配结果屏幕显示有关主数据的统计信息和图形

提示: 如果匹配完成后记录数据发生更改,那么匹配结果屏幕上的统计信息可能会过时。 要更新统计信息,请单击 刷新匹配结果 或再次运行匹配。 刷新匹配结果可能需要一些时间才能完成。

您可以随时通过选择不同的匹配属性或更改自动链接的阀值来调整匹配算法

当您将更多数据源和资产添加到 IBM Match 360 实例并重新运行匹配时,新数据将在其内部进行匹配,并与系统中的现有数据进行匹配。 通过此方式,您可为整个企业的客户构建单个统一的 360 度视图。

后续步骤

了解更多信息

父主题: 配置主数据

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more