0 / 0
Go back to the English version of the documentation
IBM Match 360 中的数据概念
Last updated: 2024年11月26日
IBM Match 360 中的数据概念

IBM Match 360 通过对一个或多个数据资产提供的记录运行匹配算法来创建主数据实体。 实体和记录是根据可定制的 IBM Match 360 数据模型定义和组成的。

在本主题中:

记录和实体

每个实体都是一个主数据对象,用于提供人员,组织或其他实体的全方位视图。 一个或多个数据记录可以添加到单个实体。

  • 记录 是一组人口统计信息,表示从单个数据源获取的个人或组织的单一观点。 如果同一人员或组织出现在多个数据源中,那么每条记录都将通过匹配算法作为单个实体链接在一起。 记录由描述人员或组织的属性和字段值组成。

  • 主数据 实体 是 IBM Match 360 确定要一起匹配的记录的组合。 数据模型可以定义两个实体类别: 身份或关联。 每个实体都包含匹配算法链接在一起的一个或多个成员记录。 IBM Match 360可以智能地确定最有可能正确描述所代表实体的属性和字段值,并在主数据工作区视图中显示这些属性和字段值。

一个或多个成员记录可以添加到实体视图。 如果使用不同的设置 (例如,使用不同的自动链接阈值或一组不同的匹配属性选择) 再次运行匹配算法,那么组成实体的成员记录可能会更改。

实体也可以由单条记录组成。 发生这种情况时,该实体称为 单项

每个实体都围绕一个 中心记录构建。 实体中最早的记录被视为中心记录。 中心记录是实体的基础,不能取消链接或移至其他实体。

添加到实体的每个记录都表示为记录与实体之间的图形边缘,由匹配处理确定。 重新运行匹配算法时,将更新表示链接的边缘。

实体类型

在数据模型中定义新实体类型时,必须确定此实体的用途:

  • 身份 实体链接所有似乎表示同一真实世界的人员,组织或对象的记录。 他们有着共同的身份。 例如,可以使用 "业务合作伙伴" 实体来匹配表示同一现实世界公司的数据中的组织记录。

  • 关联 实体链接应因其他原因 (例如,共享地址,雇主或采购决策) 而关联的记录。 关联实体类型的一个常见示例是家庭。 您可以创建将给定家庭的成员与单个实体相匹配的 "家庭" 实体类型。 通过使用家庭实体,您可以逐个家庭地跟踪和分析行为和活动。

家庭控股实体

观看以下视频,以了解如何使用关联实体来识别 IBM Match 360 数据中的家庭。

此视频提供了一种可视方法来学习本文档中的概念和任务。

创建关联实体类型以帮助您跟踪和识别共享家庭的人员记录时,需要考虑一些重要因素。 建立家庭管理标准是管理和组建家庭的关键第一步。 可以通过明确的标准,表达的标准或两者的组合来定义家庭。

显式条件 可以在数据模型中包含任何属性。 以下是您在管家策略中可能考虑的显式条件的示例:

  • 双方共享给定地址类型的相同地址,例如相同的家庭地址。
  • 参与方共享姓氏。
  • 参与方在定义的年龄范围内。
  • 各方共享联系方法,例如家庭电话号码。
  • 当事人有一定类型的关系,就像家庭关系一样。
  • 当事人在合同中具有特定的角色。 例如,父级可能对子级拥有的帐户具有法定代表人角色。

使用显式条件通过匹配算法构建家庭。 要启用 IBM Match 360 以通过算法构建家庭实体,请选择所选的显式条件作为此实体类型的匹配属性。 有关配置匹配算法的信息,请参阅 匹配数据以创建主数据实体

已表达的条件 包含不属于数据模型的其他信息。 表达的标准可能已由家庭成员或代理人口头传达。 以下是您可以在家政策略中考虑的已表达条件的示例:

  • 各方已告知他们在同一家庭内。
  • 代理在客户帐户的初始设置期间收集了家庭信息。

要根据表达的条件构建家庭实体,必须手动链接记录以形成实体。 通过使用主数据工作区编辑记录的链接规则,可以创建手动记录链接。 有关更多信息,请参阅 探索 IBM Match 360 with Watson中的主数据实体和记录

确定实体的属性值

主数据实体可以包含两类属性:

  • 从实体的成员记录组合其值的属性。
  • 其值直接存储在实体中的属性,称为 实体属性
组合属性
实体从其成员记录中定义的值派生其许多属性值。 使用一组属性组合规则从实体的成员记录中选择实体的属性值。 您可以为数据模型中的每个实体类型定义和定制属性组合规则。 有关属性组合的更多信息,请参阅 在 IBM Match 360中定义属性组合规则
实体属性
实体属性直接在实体中定义,而不是从其成员记录进行组合。 在实体类型的数据模型中定义实体属性。 有关修改数据模型的信息,请参阅 定制数据模型
  • 要更改实体属性的值,请直接编辑实体。 编辑成员记录不会影响实体属性的值。 有关编辑实体的信息,请参阅 在 IBM Match 360中添加和编辑记录和实体
  • 首次由匹配算法创建实体时,该实体未定义任何实体属性值。 在主数据工作区中编辑实体,为实体属性提供值。
  • 如果通过手动 linkunlink 操作或者通过对匹配算法的更改来删除具有填充实体属性值的实体,那么其实体属性值将转移到任何存活的实体。
  • 如果合并了两个都具有实体属性的实体 (匹配或手动链接) ,那么生存实体标识的实体属性值优先。 如果所讨论的属性由值列表组成,那么系统将合并来自两个实体的列表。 合并可确保列表不包含任何重复值。 如果两个列表都包含相同的值,那么该值仅在合并的列表中出现一次。

实体持久性

在定义数据模型时,可以配置每种实体类型的复合视图是保存在数据库中,还是根据需要由其成员记录组成。 当实体类型被配置为持久化时,每个实体的合成属性都会存储在数据库中,与记录属性的存储方式类似,这意味着实体数据更加稳定、更具弹性。

当实体被配置为持久化时,数据管理员和业务用户可以直接搜索实体数据,包括补充属性、审计属性以及记录数和实体 ID 等系统属性。 用户可使用主数据资源管理器界面中的简单或高级搜索机制搜索持久化实体。

根据主数据中实体的数量,在数据库中存储实体复合视图会导致数据库的大小显著增加。

有关定义实体类型的更多信息,请参阅自定义数据模型

IBM Match 360 数据模型

数据模型定义与装入到 IBM Match 360中的数据相关联的元数据。

数据模型包含 IBM Match 360 中用于标识和分类数据中存在的信息的属性和规则。 数据模型由不同类型的元数据组成:

您可以定义自己的记录类型,属性类型和关系类型以满足组织的需求。 通常无法定制系统属性。

系统属性 (审计属性)

数据模型中的系统属性增强了您在 IBM Match 360 中审计数据的能力,以帮助确保符合数据监管规则。 系统属性由系统定义,捕获和存储,不可用于定制或修改。 存在与数据模型的四个不同元素相关联的系统属性: 记录类型,实体类型,属性类型和关系类型。

  • 记录类型 系统属性在记录级别存储系统信息。 例如:

    • record_last_updated 跟踪每个记录的上次更新时间。
    • record_number 存储每个记录的系统生成的标识号。
  • 实体类型 系统属性在实体级别存储系统信息。 例如:

    • created_date 存储创建实体的时间和日期。
    • link_last_updated_date 跟踪上次更改实体的成员记录的时间和日期。
    • last_updated_date 存储上次更改实体的补充属性的时间和日期。
    • last_updated_user 跟踪对实体的补充属性进行最新更改的用户。
  • 属性类型 系统属性在属性级别存储系统信息。 例如, attribute_last_updated 会跟踪最近一次更新每个属性的时间。

  • 关系类型 系统属性在关系级别存储系统信息。 例如:

    • relationship_last_updated 跟踪最近一次更新每个关系的时间。
    • relationship_number 为每个关系存储系统生成的标识号。

观看以下视频,以了解如何查看 IBM Match 360 在添加或编辑记录数据时创建的系统生成的审计属性。

此视频提供了一种可视方法来学习本文档中的概念和任务。

记录类型

数据模型中的记录类型定义了与组织所需的域和用例相关的各种类型的记录。 每个记录类型都由以下属性或对象组成:

  • label 是记录类型的标签。
  • description 是记录类型的简短描述。
  • entity_types 包含此记录类型中包含的所有实体类型的对象。 每个 entity_type 对象都包含一个标签,描述以及可选的实体类型 (身份或关联)。
  • attributes 是包含与记录类型关联的所有属性的对象。 每个定义的属性都包含以下属性:
    • label -属性的标签。
    • description -属性的描述。
    • attribute_type -此属性的属性类型。
    • cardinality -属性 (列表或单个) 的基数。 基数定义此属性可具有的值数。
    • indexed -指示是否对属性建立索引以支持对其内容进行自由文本搜索的布尔字段。

属性类型

数据模型中的属性类型定义可与记录类型或关系类型关联的属性类型。 每个属性类型条目都由以下属性或对象组成:

  • label 是属性类型的标签。
  • description 是属性类型的简短描述。
  • matching_types 指示要对此属性类型的所有属性应用的匹配函数的类型。
  • fields 包含属于此属性类型的所有字段的定义。 每个字段都由 labeldescriptionindexed 属性组成。

关系类型

数据模型中的关系类型定义了可在此数据中分配的关系类型。 每个定义的关系类型都包含以下属性和对象:

  • label 是关系类型的标签。
  • description 是关系类型的简短描述。
  • label_from_source 是从源的角度查看的关系标签。 例如: "Manages"。
  • label_from_target 是从目标的角度查看的关系标签。 例如: "Reports to"。
  • cardinality 定义关系的基数 (例如一对多或一对一)。
  • directional 指示此类型的关系是方向性的 (根据您正在查看的关系 (例如,医生/患者关系) 的哪边不同) 还是双向的 (来自关系双方的相同,例如,对等关系)。
  • attributes 是一个对象,其中包含属于此关系类型的所有属性的定义。 attributes 对象的结构与记录类型属性的结构相同。
  • rules 是定义此关系类型的源规则和目标规则的对象。
    • source 规则的对象包含在创建此类型的关系时可用作源的记录类型和实体类型的列表。
    • 目标 规则的对象包含在创建此类型的关系时可用作目标的记录类型和实体类型的列表。

了解更多信息

父主题: 管理主数据

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more