0 / 0
Go back to the English version of the documentation
设计数据类 (IBM Knowledge Catalog)
Last updated: 2024年7月29日
设计数据类 (IBM Knowledge Catalog)

设计数据类时,必须决定是否对此数据类启用数据匹配,它应该与哪些业务术语或分类相关,以及是否定义数据类之间的分层关系。

所需许可权
要编写数据类,必须具有此用户许可权
- 访问监管工件
此外,您必须在数据类的主类别中具有以下类别合作者角色之一:
  • 管理员
  • 所有者
  • 编辑者
  • 具有创建数据类许可权的定制角色。

有关更多信息,请参阅 必需许可权

数据类的属性

数据类具有与其他监管工件相似的这些标准属性。

属性或行为 支持? 说明
必须具有唯一名称? 数据类名在类别中必须唯一。
描述? 可选。 包含描述以帮助用户查找此数据类。
将关系添加到其他数据类? 请参阅 数据类之间的关系
是否将关系添加到其他类型的监管工件? 请参阅 与其他类型的监管工件的关系
要向资产添加关系吗? 请参阅 目录中的资产关系
要添加定制属性吗? 请参阅 监管工件和目录资产的定制属性和关系
添加定制关系? 请参阅 监管工件和目录资产的定制属性和关系
按类别组织? 工件的主类别确定可以查看或修改工件的人员。 请参阅 类别 (Categories)
从文件导入? 请参阅导入监管工件
从 Knowledge Accelerator 导入?
导出到文件? 请参阅 导出监管工件
由工作流程管理? 请参阅 工作流程 (Workflows)
指定有效的开始日期和结束日期? 请参阅 生效日期
要分配管理员吗? 请参阅 专员 (Stewards)
添加标记作为属性? 请参阅 标记 (Tags)
要分配给资产吗?
要分配给数据资产中的列吗? 可以手动或自动将数据类添加到数据资产中的列。
在概要分析或扩充期间自动分配资产? 请参阅 管理元数据扩充
预定义工件? 请参阅 预定义数据类 (Predefined data classes)
添加正则表达式 (regex) 模式? 有限的 某些使用正则表达式模式的自定义数据类型可能无法运行屏蔽流或无法预览屏蔽数据示例。 例如,您不能使用捕获组(如 ([abc])),但可以使用非捕获组 (?:[abc])

数据类之间的关系

您可以使用层次结构来创建数据类之间的关系。

对于当前处理的数据类,您可以定义与同一类别中其他数据类的以下关系:

  • 父数据类
  • 从属数据类

父数据类用于在父/子关系中组织数据类。 如果使用自动匹配数据方法,那么它也充当一种 "预过滤器": 如果父数据类具有匹配数据方法,那么仅当父数据类的数据匹配方法返回了正匹配时,才会评估子数据类的数据匹配方法。 这表示如果定义父数据类,它就会影响数据分类流程用于确定是否应分配数据类以分析数据字段的条件。

示例:

  • 美国许可证-父数据类
  • 佐治亚州驾驶证依赖数据类

与其他类型的监管工件的关系

您可以添加以下相关工件:

  • 分类
  • 业务术语

您添加的分类和业务术语是对数据类所分配到的列的建议。

在添加数据类与业务术语之间的关系时,当在元数据扩充期间分配资产的相关数据类时,会自动将这些业务术语分配给资产。 例如,数据类 电子邮件地址 可以与业务术语 联系方法相关。 当元数据扩充过程检测到与数据类 Email address匹配的列时,将同时分配数据类 Email address 和业务术语 Contact method 。 请参阅 自动术语分配 (Automatic term assignment)

但是,将数据类的其中一个相关业务术语分配到列时,不会自动分配该数据类。

可以在数据保护规则中包含数据类,以标识要控制的数据类型。

使用数据类

要创建数据类:

  1. 打开 监管> 数据类
  2. 单击 新建数据类 以创建新的数据类并提供所需的信息。 如果数据类属于不同类别,那么可具有相同的名称。
  3. 单击另存为草稿。 现在,处于草稿状态的数据类已准备好进行优化,如以下部分中所示。
  4. 准备就绪后,根据 工作流程 定义,单击 发布发送以进行核准

要编辑现有数据类:

  1. 打开数据类,然后单击要更改的字段旁边的 a + 图标编辑
  2. 单击另存为草稿。 处于草稿状态的数据类现在已准备好进行优化。
  3. 根据 工作流程 定义,单击 发布发送以待核准

您可以提供以下信息来定义数据类:

  • 示例属性中为数据类添加示例。 如果指定名为 City-New 的数据类,那么示例可以为 London

  • 将此数据类分配给主类别,也可以选择分配给辅助类别。

  • 编辑在 详细信息 部分中提供其他信息的定制属性。
    可以创建定制属性,如 监管工件和目录资产的定制属性和关系中所述。 如果定义了任何定制关系类型,那么它们也将显示在此处。 在您发布创建关系的工件后,反向关系会显示在另一个工件中。

  • 使用数据匹配来组织数据库列和数据文件字段以进行复审和后续列分析工作。 例如,通常,具有数字数据的数据库列包含有效值范围内的数字。

  • 启用或禁用自动分配的数据类。 要启用数据类,需要启用数据匹配。 启用了数据匹配方法的数据类被视为 已启用 数据类,禁用了数据匹配方法的数据类被视为 已禁用 数据类。

  • 选择数据类的匹配优先级以确定哪个数据类候选应该成为字段的推断数据类。 仅考虑置信度高于阈值的数据类。 请参阅 优先级 (Priority)

  • 指定相关工件。 只能选择已发布的业务术语和分类。 您在此处添加的分类和业务术语是对分配了数据类的列的建议。 您可以在列级别分配一个或多个分类。

  • 添加其他相关内容。

根据为数据类设置的 生效日期 ,它是 activeinactive。 活动数据类可用于指定操作,例如,自动对数据进行分类。 不活动数据类在变为活动状态之前不会对任何操作作出贡献。

无法使用草稿数据类来指定数据匹配或执行任何其他操作。 缺省情况下,如果将数据类发送以供核准,那么将发布该数据类。

您还可以使用数据匹配方法根据 Knowledge Accelerators 中提供的其中一个参考数据集来创建其他数据类。 请参阅 Knowledge Accelerators中的参考数据集

了解更多信息

父主题: 数据类

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more