您可以在目录外创建 CSV(逗号分隔值)格式的参考数据集,然后导入或重新导入值。 您还可以导入多个参考数据集中的值之间的值映射关系。
使用下列其中一种方法来导入参考数据集:
使用 API 请求从先前导出的 ZIP 文件导入一个或多个参考数据集。
在导入 ZIP 文件中的参考数据集时,如 "从实例中导入 ZIP 文件中的所有治理工件"中所述,必须始终在 API 调用中使用 "
merge_option=all
。使用用户界面或 API 请求从 CSV 文件导入参考数据集定义。 可在一个文件中导入多个参考数据集定义。 此方法不包括参考数据值,必须单独导入。
使用 UI 或 API 请求从 CSV 文件导入特定集合的参考数据值。
使用 UI 或 API 请求将相关参考数据值从 CSV 文件导入到现有参考数据集。
IBM Knowledge Catalog计划对您可以创建的参考数据集的数量和大小有限制。
在 ZIP 文件中导入或导出参考数据集时,该文件包含一个 CSV 文件,该文件定义该 ZIP 文件中包含的参考数据集,并且在单独的文件夹中,每个集有一个 CSV 文件及其参考数据值。 这些 CSV 文件具有不同的格式。
参考数据集定义CSV 文件包含每个包含数据集的属性信息,如工件 ID、名称、描述、所属类别和参考数据集类型。 它可能具有以下格式:
artifact_id,Name,Artifact Type,Category,Description,Secondary Categories,Related Terms,Data Set Type
026df326-74f2-4dce-8d6b-7d2f36b09d98,Customer Non Performing Loan Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,Distinguishes between Customers according to their number of outstanding non-performing loans.,ecf8fade-4956-4e92-9a56-308949f0cb58,a9a63e90-94df-4b00-95ec-a951189d2183,TEXT
0544a0b7-07b7-4509-8cbe-22e36caa218b,Household Life Cycle Status,reference_data,8a72919e-8c40-4a73-b190-4803deb2160d,Distinguishes between Households according to the state of existence of the Household.,ecf8fade-4956-4e92-9a56-308949f0cb58,3a6f0d98-64fc-4166-b3e4-7f2ebcbeac9f,TEXT
07cf348c-76a3-482c-9614-2b89edabbaaf,Financial Legal Status,reference_data,54b9bd8a-ddfb-4512-8d46-e26d2926981e,"Distinguishes between Individuals or Organizations according to whether they are undergoing proceedings that affect their financial standing; for example, (US) Chapter 11 status, In Liquidation, In Receivership, Bankrupt.",ecf8fade-4956-4e92-9a56-308949f0cb58,03976617-abe9-4e5a-88cf-57193b22cce1,TEXT
参考数据值的 CSV 文件至少包括以下为参考数据集定义的列:
- 代码
- 值
- 描述(可选)
- Parent(可选)
它还可能包含其他信息,例如相关参考数据值或定制列。
例如,NAICS 代码参考数据集的前几行如下所示:
Code,value,description,parent
11,Agriculture, Forestry, Fishing and Hunting
111,Crop Production,Crop Produ,11
1111,Oilseed and Grain Farming,111
11111,Soybean Farming,Soybean Farming,1111
111110,Soybean Farming,Soybean Farming,1111
11112,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111
111120,Oilseed (except Soybean) Farming,Oilseed (except Soybean) Farming,1111
请阅读有关以 用于导入监管工件的 CSV 文件格式格式化 CSV 文件的更多信息。 监管工件的导入方法中描述了不同的导入方法。
以下部分描述了如何使用 UI 为参考数据集导入 CSV 文件。 在 UI 中,您可以查看导入任务的进度条,还可以查看导入的摘要以及错误描述。 请注意,导入参考数据值时,导入摘要中列出的已保存值的数目可能与实际导入值的数目不同。 这是因为 CSV 文件中的所有重复项都计为已保存的值,而最终仅导入其中一个重复项 (取决于您选择的重复项处理方法)。
导入带有参考数据集定义的文件
- 从主菜单中选择治理>参考数据。
- 单击添加参考数据集,然后选择从文件导入。
- 选择包含上述参考数据集定义的 CSV 文件。
- 选择合并选项。 请注意,这些选项与参考数据集的定义有关,而不是其值。 这些值必须在另一个步骤中导入。
- 点击下一步
因此,创建了一个新的参考数据集定义。 创建后,您可以手动添加数值,或从另一个 CSV 文件导入数值,如下文任务所述。
导入具有参考数据值的文件
在所选参考数据集中,单击 上载文件 以选择要从中导入值的 CSV 文件:
- 该文件中包含现有代码的行会更新现有的行。
- 包含新代码的行会进行添加。
从 CSV 文件导入值时,会将该文件中的列映射到任何缺省列或定制列。 如果这些列不存在,那么可以创建这些列。
导入定制列
缺省情况下,参考数据集中的值具有以下列: 代码,值,描述 (可选) 和父代 (可选)。 但是,您可能希望捕获与 定制列中的代码相关的其他信息。 比方说,您可能有国家或地区代码的参考数据集,并希望捕获一些其他属性,例如国家或地区的总理、语言或备用名称。
您可以在从定义了此类列的 CSV 文件创建参考数据集期间,或者在从 CSV 文件导入值或将值重新导入到现有参考数据集时,添加定制列。
请参阅包含定制列的 CSV 文件部分的以下示例。 此文件可用于导入或重新导入值。
code,value,description,Capital City,National Day,Official Language,Population
AFG,Afghanistan,The Islamic Republic of Afghanistan,Kabul,19/08/1919,دری,37200000
ALA,Åland Islands,Åland,Mariehamn,07/05/1920,svɛ̂nːska,28007
ALB,Albania,The Republic of Albania,Tirana,28/11/1912,Albanian,2850000
DZA,Algeria,The People's Democratic Republic of Algeria,Algiers,05/07/1962,الجزائر,42200000
ASM,American Samoa,The Territory of American Samoa,Pago Pago,14/06/1889,English,55465
要将定制列导入参考数据集,请执行以下操作:
- 打开参考数据集,然后单击 上载文件。 提供 CSV 文件,然后单击 下一步。
- 将文件中的列映射到参考数据集中的缺省列或现有列。 要添加新的定制列,请从 目标列 下拉列表中选择 + 添加定制列 (可选)。
- 提供列名,描述,最大字符数,并指定是否根据另一参考数据集的代码验证列值。
- 您可以将定制列标记为 组合键的一部分。 缺省情况下,作为组合键一部分的定制列是必需的。
- 对要映射的 CSV 文件中的每个列重复步骤。
- 映射所有列时,请查看信息,根据需要重新排列列,然后单击 保存。
导入相关值
您可以使用 CSV 文件导入参考数据集中的值之间的关系。 源和目标参考数据集中的值必须存在于系统中才能创建关系,否则不会导入这些关系。 首先导入两个相关参考数据集,然后使用相同的 CSV 文件来导入关系。
请参阅带有值映射的 CSV 文件的以下示例。
code,value,description,map_1_n_to_states,map_1_1_continents
IND,India,Asian country,"KA,AP,MP,DL,GJ",ASIA
USA,America,North American Country,"CA,FL,NY,TX",NorthAmerica
GER,Germany,European Country,,Europe
要通过导入 CSV 文件来添加相关值,请完成以下步骤:
- 打开要为其添加相关值的参考数据集。
- 从三个点菜单中单击 上载相关值。
- 通过将您要上载的文件拖动到导入相关值窗口或通过浏览以查找该文件,从而添加该文件。 然后,单击下一步。
- 从文件中选择具有要映射到一个或多个其他代码值的代码值的列。
- 选择您希望在每个值和相关值之间存在的关系类型(一对一或一对多)。
- 从文件中选择具有要映射到的参考值的相关代码以及相关值所属的参考数据集的列。
- 单击保存。
注: 使用具有由组合键定义的参考数据值的 CSV 文件时,请确保这些值与单映射和多映射相关值之间的父关系表示为由 | 定界的 CODE 和组合键定制列值的并置。代码始终首先使用组合键列值,然后使用组合键列值,例如: CODE|CC1|CC2|CC3
。
了解更多信息
父主题: 参考数据