Knowledge Accelerators 数据类是什么 | IBM Cloud Pak for Data as a Service

Go back to the English version of the documentation

Knowledge Accelerators 数据类

Last updated: 2024年6月21日

Knowledge Accelerators 数据类是什么

Knowledge Accelerators 扩展了 IBM Knowledge Catalog 中提供的数据类集，这些数据类描述了跨多个行业的资产中常见的数据类型，以及基于 ISO ， FHIR 和 CIM 等行业标准的数据类。这些新数据类描述了 Energy and Utilities， Financial Services， Healthcare， Insurance和其他跨行业数据源中的常用信息。

数据类描述数据资产中包含的数据的类型和特征。它们在 IBM Knowledge Catalog 元数据扩充期间用于对数据进行概要分析。 Knowledge Accelerators 包含特定于行业的数据类，这些数据类使用来自参考数据集或有效值列表的代码，添加正则表达式以标识数据模式或列名匹配条件。

Knowledge Accelerators 数据类增强了 IBM Knowledge Catalog 扩充过程识别特定于行业的数据的能力。现有 IBM Knowledge Catalog 数据类和 Knowledge Accelerators 提供的新数据类都根据诸如人口统计信息，财务和位置之类的主题组合在新的类别层次结构中。此子分类允许它们选择性地包含在不同的元数据扩充项中，以提高匹配准确性。由于数据类预先映射到 "业务核心词汇表" 中的术语，因此元数据扩充在将资产中的数据与数据类相匹配时，还会自动分配业务术语。

与个人数据相关的数据类还具有个人信息 (PI) 或敏感个人信息 (SPI) 的分类，具体取决于其描述的数据的敏感度。这种分类有助于识别数据资产中的个人数据，并支持应用数据保护规则来控制数据访问。

数据类是完全可定制的，如果需要，可以进行调整，以关注特定于客户机的参考数据集或列名匹配限制。

注：

IBM Knowledge Catalog 随附的一组数据类保存在顶级 "未分类" 类别中。导入任何 Knowledge Accelerators 都会创建这些数据类的副本，其中添加了 PI/SPI 分类，并将其与新的 Knowledge Accelerators 数据类一起放置在新的 "数据类" 类别层次结构的子类别中。

在对业务术语或数据资产分配的任何现有关系进行复审后，可以从 "未分类" 中除去重复的数据类，这些数据类可能需要传输到使用 Knowledge Accelerators导入的新副本。

表 1. 数据类示例
行业	数据类	描述	主类别	匹配方法	参考数据集	参考数据值	业务术语
跨行业	国际电话号码	收集识别电信服务所定义的特定电话号码的信息 ...	公共数据类	与正则表达式中的条件匹配	正则表达式	示例： +14655551212 +4402079460111 003530209138764	电话号码
能源和公共事业	建筑物类型	已构造的建筑物结构的类型。	公共数据类	与有效值列表匹配	有效值	已拆离平房 cottage 大牧场圆顶 ...	建筑物类型
金融服務	货币代码	用于表示货币的标准代码，使用数字或字母代码。此数据类包含来自 ISO 4217 货币代码的内容。	财务数据类	与有效值列表匹配	有效值	1.5 EUR GBP SEK 日元 ...	货币代码
医疗保健	血液组类型	根据 ABO/Rh 状态对血型进行分类。	运行状况和生物特征数据类	与有效值列表匹配	有效值	A + A- B + B- O + O- ...	血液组
保险行业	车辆类型	与车辆型号关联的类型或分类。	KAIN-车辆信息和事故数据类	与参考数据匹配	车辆类型	轿车踏板循环农用车辆基于 500cc 的摩托车 7.5 吨及以上 ..	车辆类型

注: 以上示例中列出的许多数据类与多个行业相关，因此在适当情况下在 Knowledge Accelerators 中共享。

了解更多信息

请参阅 IBM Knowledge Catalog中的数据类。