0 / 0
Go back to the English version of the documentation
设计参考数据集 (IBM Knowledge Catalog)
Last updated: 2024年6月21日
设计参考数据集 (IBM Knowledge Catalog)

设计参考数据集时,必须决定要使用的值的格式,构成该集的代码/值对以及该集是否应该与任何其他现有集相关。 您可以导入已存在的参考数据集并对其进行修改以满足您的需求,或者手动创建新的参考数据集。

参考数据用于对企业应用程序和数据库中的其他数据进行分类。 参考数据可能由 ISO 等组织进行标准化。 参考数据可以是分层的。 同一域可能有多个参考数据集,在这种情况下,可以指定参考数据值之间的映射。

参考数据集由多个参考数据值组成,其中每个参考数据值必须至少定义一个代码及其值。

您可以使用 UI 创建新的参考数据集,也可以从 CSV 文件导入其属性。 对于参考数据值也是如此-可以手动添加这些值,也可以从 CSV 文件导入这些值。 请注意,参考数据集和参考数据值的 CSV 文件不同。

可以使用下列其中一种方法来导入参考数据集:

  • 使用 API 请求从先前导出的 ZIP 文件导入一个或多个参考数据集。 ZIP 文件包含一个 CSV 文件,其中的属性定义了一个或多个参考数据集,并且每个参考数据集都有一个 CSV 文件列出了参考数据值。
  • 使用 UI 或 API 请求从 CSV 文件导入参考数据集信息。 可以在一个文件中导入多个参考数据集。 此方法不包含参考数据值-必须单独导入这些值。
  • 使用 UI 或 API 请求从 CSV 文件导入特定集合的参考数据值。

要了解这些导入方法以及它们之间的差异,请参阅 导入监管工件的方法

您还可以使用其中一个 预定义参考数据集。 此外,每个 Knowledge Accelerator 都为您可以使用的特定行业提供数百个参考数据集。 请参阅 Knowledge Accelerators中的参考数据集

IBM Knowledge Catalog 套餐 对您可以创建的参考数据集的数量和大小有限制。

参考数据集的属性

参考数据集具有与其他监管工件相似的这些标准属性。

属性或行为 支持? 说明
必须具有唯一名称? 参考数据集名称在类别中必须唯一。
描述? 可选。 包含描述以帮助用户查找此参考数据集。
是否将关系添加到其他参考数据集? 请参阅 与其他参考数据集的关系
是否将关系添加到其他类型的监管工件? 请参阅 与其他类型的监管工件的关系
要向资产添加关系吗? 请参阅 目录中的资产关系
要添加定制属性吗? 请参阅 定制属性和关系
添加定制关系? 请参阅 定制属性和关系
按类别组织? 工件的主类别确定可以查看或修改工件的人员。 请参阅 类别 (Categories)
从文件导入? 请参阅导入监管工件
从 Knowledge Accelerator 导入?
导出到文件? 请参阅 导出监管工件
由工作流程管理? 请参阅 工作流程 (Workflows)
指定有效的开始日期和结束日期? 请参阅 生效日期
要分配管理员吗? 请参阅 专员 (Stewards)
添加标记作为属性? 请参阅 标记 (Tags)
预定义工件? 物理位置,主权位置。 请参阅 预定义参考数据集

创建新的参考数据集时,必须决定要使用的类型。 您选择的类型确定参考数据值的值列的格式:

text
可以是字符串或多行字符串。
成员
不支持布尔值,二进制值或十六进制值。
Date
ISO 日期时间格式。

参考数据值的属性

参考数据集包含多个参考数据值。 这些值至少由以下列组成:

代码
最多 255 个字符的字符串。 代码列始终为 "文本" 类型。
值的格式由参考数据集类型 "文本" , "数字" 和 "日期" 确定。
描述
值是可选的。
父代
值是可选的。 父关系指向同一集中的另一个参考数据值。 通过指定父代,您可以构建参考数据值层次结构树。

区分大小写的代码

2024 年 2 月 16 日引入了区分大小写的代码。 对于在该日期之后创建的所有参考数据集,代码列区分大小写。 将值添加到新的参考数据集时,将完全按照您输入的内容保存代码。 以下代码被视为三个唯一条目:

  • 美國
  • 我们
  • 微秒

之前,所有代码在保存时都会自动更改为大写,例如:

  • us 已另存为 US
  • 1pl 已另存为 1PL

请注意,在引入此更改之前创建的任何参考数据集都将保持不区分大小写,并且在其中添加的任何新值都将以大写形式保存。 这些参考数据集在 UI 中使用 不区分大小写 标记进行标记。

定制列

您可能需要捕获与代码相关的其他信息,例如,不同语言的值翻译或其他与您的需求相关的支持属性信息。 比方说,您可能有国家或地区代码的参考数据集,并希望捕获一些其他属性,例如国家或地区的总理、语言或备用名称。 出于此类目的,您可以使用 UI 通过以下方式添加定制列:

  • 您可以在创建新的参考数据集时手动定义定制列。 请注意,一旦创建了参考数据集,就无法手动修改或添加定制列。
  • 您可以使用 CSV 文件导入来创建新的参考数据集,并将该文件中的列映射到新的定制列。
  • 您可以将 CSV 文件中的值导入或重新导入到现有参考数据集,并使用列映射来创建新的定制列。

有关更多信息,请参阅 导入定制列

组合键

集合中的参考数据值由唯一代码标识。 但是,您可能需要使用多个列来标识数据。 组合键 是代码列与参考数据集中最多 5 个定制列的组合。 组合键用于唯一地标识每个参考数据值。 使用组合键时,代码列中的值不再需要唯一。 仅当组合所有指定列的值时,才保证唯一性-各个列中的值不一定唯一。

当您为集合定义组合键时,此类集合中的每个参考数据值将通过组合键的物理表示在系统中标识,该组合键是代码列和组合键定制列的并置,其顺序与最初创建集合时指定的顺序相同。 值由 | 定界,例如: CODE|CC1|CC2|CC3。 此物理表示用于标识系统中的参考数据值 (例如,用于跟踪关系) ,并且无法对其进行更改。

要了解如何使用组合键创建参考数据集,请参阅 使用组合键创建参考数据集

与其他类型的监管工件的关系

数据类与参考数据集之间的关系: 数据类可以在数据匹配方法中包含参考数据集。 然后,参考数据集用于评估数据资产中的列是否满足分配数据类的条件。 请参阅 将数据匹配添加到数据类

与业务术语的关系: 您可以将业务术语分配给参考数据集或特定参考数据值,以进一步定义代码的含义。

与其他参考数据集的关系

您可以为参考数据集创建分层关系,以在它们之间建立逻辑连接。 您还可以在参考数据集中的值之间创建关系。 请参阅 参考数据集之间的关系

使用参考数据集

您可以通过以下方式使用参考数据集:

  • 单击 (下载图标) 以下载 CSV 文件中的参考数据值。 然后,您可以在本地编辑 CSV 文件,这通常为您的工作提供更多速度和灵活性。
  • 通过从参考数据名称旁边的操作菜单中选择 上载文件 并遵循指示信息,从 CSV 文件导入值。
  • 通过单击 ("添加"图标) 来创建您自己的值。
  • 通过单击 (编辑图标) 来编辑参考数据值 (其值,描述或父值)。
  • 通过单击 管理列来重新排列列在参考数据值视图中的显示方式。
  • 通过单击 删除值来删除参考数据值。 使用 Ctrl 键标记多个要删除的值。
  • 相关工件 分配给参考数据集,例如业务术语或分类。
  • 将相关业务术语添加到所选值。
  • 将相关值添加到所选值。 您可以关联同一集合中的值或不同集合之间的值。 通过从参考数据名称旁边的操作菜单中选择 上载相关值 并遵循指示信息,可以从 CSV 文件导入这些值。

要了解有关所有监管工件的公共任务的更多信息,请参阅 管理监管工件

了解更多信息

父主题: 参考数据

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more