您可以使用文件导入监管工件。 您可以一次导入一种治理工件,也可以从另一个IBM Knowledge Catalog实例导入所有治理工件。
部署环境之间的兼容性
您可以在以下部署环境的IBM Knowledge Catalog实例之间导出然后导入治理工件:
- Cloud Pak for Data 3.5
- Cloud Pak for Data 4.x
- Cloud Pak for Data as a Service
在IBM Knowledge Catalog实例Cloud Pak for Data as a Service和Cloud Pak for Data 3.5或4.x 之间,管理人的值不兼容。
您可以将治理工件从IBM InfoSphere Information Governance Catalog导入到Cloud Pak for Data 3.5和4.x 上的IBM Knowledge Catalog实例。 要将治理工件从IBM InfoSphere Information Governance Catalog导入到Cloud Pak for Data as a Service 上的IBM Knowledge Catalog实例,您必须编辑每个 CSV 文件,使其符合IBM Knowledge Catalog工件 CSV 文件的格式。 例如,您可能需要进行以下类型的编辑:
- 除去不受支持的列
- 将不同工件类型分隔成多个 CSV 文件
- 修改受支持的列
- 添加必需列
导入方法的比较
针对您的目标和情况选择相应的导入方法。
- 导入单一类型的工件
您可以使用 CSV 文件一次导入单一类型的监管工件。
此方法在以下类型的情况下很有用:
- 您希望导入的工件受工作流程约束。
- 您想要将属性的值添加到一种类型的监管工件。 将该工件类型导出为 CSV 文件,编辑该 CSV 文件,然后将其导入。 例如,您可以使用此方法向业务术语添加定制属性。
- 您希望在另一个程序中定义工件。 为每种工件类型创建 CSV 文件。 例如,您可以使用此方法在电子表格程序中定义工件,然后导入这些工件。
- 导入多种类型的工件
您可以使用通过从IBM Knowledge Catalog实例导出多种类型的现有治理工件而创建的 ZIP 文件导入多种类型的治理工件。 ZIP 文件包含类别和每个导出的工件类型的 CSV 文件。 CSV 文件与 CSV 导入文件的格式相匹配,但以下文件除外:
- 额外的 工件标识 列,其中包含工件的标识,而不是按名称和类别路径来标识工件。
- 相关工件是使用工件标识而不是上下文和名称定义的。
此方法在以下类型的情况下很有用:
- 您想将所有管理工件从一个IBM Knowledge Catalog实例移动到另一个。
下表汇总了使用 CSV 文件或 ZIP 文件导入工件之间的差异。
特点 | CSV 文件 | ZIP 文件 |
---|---|---|
文件创建 | 导出一种类型的现有工件 在电子表格程序中创建文件 从 IBM InfoSphere Information Governance Catalog 并调整格式 |
从实例中导出多种类型的工件 |
工件类型数 | 每个文件的类别或一个工件类型。 | 多种类型的工件,在单独的 CSV 文件中包含类别和每种类型的工件。 |
导入方法 | 通过 UI API 请求 |
API 请求 |
工作流程 | 所有工件都将作为草稿导入,并且受工作流程约束。 将立即发布类别,因为它们不受工作流程约束。 | 将立即发布所有工件和类别。 |
必需的许可权 | 创建或编辑类别的许可权。 您必须至少是要导入到的类别中的编辑者。 有关详细信息,请参阅 必需的许可权。 | 管理词汇表 许可权 |
可以导入的监管工件
通过这两种导入方法,您可以导入 类别 和以下类型的监管工件:
限制:
- 您可以导入这些类型的监管工件的所有属性的值,包括与其他工件的关系。 但是,仅当相关工件存在或在同一导入过程中定义时,才会导入关系。 要添加导入过程跳过的关系,请先发布所有导入的草稿工件,然后再次运行导入过程。
- 无法使用 CSV 在 Cloud Pak for Data 实例之间移动监管工件及其关系。 例如,如果尝试使用匹配方法 匹配引用数据 将数据类导出到 CSV ,然后将其导入到另一个 Cloud Pak for Data 实例中,那么导入将失败,因为 CSV 导入和导出中不包含工件标识。 请改为使用 ZIP 导入。
- 从 CSV 文件导入参考数据集时,不会导入该集的参考数据值。 您必须使用单独的 CSV 将值导入到数据集中。 或者,可以使用 ZIP 导入来导入参考数据集及其参考数据值。 有关更多信息,请参阅 导入参考数据集的文件。
- 无法导入数据保护规则或数据位置规则。
用于合并已导入工件和现有工件的方法
无论您是使用 CSV 文件还是 ZIP 文件导入工件,都必须选择导入已存在且属性值不同的监管工件时发生的情况。 下表总结了三种合并方法。
合并方法 | 个 API | 对原始值的影响 | 对导入值的影响 |
---|---|---|---|
替换所有值 | merge_option=all |
废弃所有原始值。 | 接受所有导入的值,甚至是空值。 |
替换为定义的值 | merge_option=specified |
如果导入的值为空,请保留原始值。 | 接受所有导入的值 (空值除外)。 |
替换空值 | merge_option=empty |
保留原始值 (空值除外)。 | 仅接受替换空值的导入值。 |
对于新工件,这些方法中的每个方法都会生成相同的结果。
替换所有值
将废弃工件的所有原始值,并将其替换为导入的工件的值。 如果导入的工件的属性值为空,那么将除去该属性的任何原始值。
例如,假设您有一个名为 release 的已发布业务术语,并导入 CSV 文件以进行修改。 下表显示了 替换所有值 选项的效果:
属性 | 初始值 | CSV 文件中的值 | 生成的值 |
---|---|---|---|
名称 | 发行版 | 发行版 | 发行版 |
工件类型 | glossary_term | glossary_term | glossary_term |
类别 | marketing | marketing | marketing |
描述 | example term | example term edited | example term edited |
标记 | beta | beta | |
相关术语 | marketing>> 版本 | marketing>> 日期 | marketing>> 日期 |
分类 |
|
生成的草稿工件对原始值进行了以下更改:
- 原始描述将替换为新描述。
- 标记的原始空值将替换为值。
- 原始相关术语将替换为新的相关术语。
- 原始分类值将替换为空值。
使用 all
合并选项时,必须确保所有 CSV 内容在工件之间的关系方面一致。 例如,如果 ZIP 导入文件同时包含术语和与关系连接的数据类,那么此关系必须同时存在于数据类 CSV 和术语 CSV 中。 否则,关系导入行为不可预测,可以导入关系,也可以不导入关系。
导入包含参考数据值的 ZIP 文件时,必须始终在 API 调用中使用 merge_option=all
。
替换为定义的值
工件的原始空值将替换为已导入工件所提供的值。 如果已导入工件的属性值为空,那么将保留该属性的任何原始值。
例如,假设您有一个名为 release 的已发布业务术语,并导入 CSV 文件以进行修改。 下表显示了 替换为定义的值 选项的效果:
属性 | 初始值 | CSV 文件中的值 | 生成的值 |
---|---|---|---|
名称 | 发行版 | 发行版 | 发行版 |
工件类型 | glossary_term | glossary_term | glossary_term |
类别 | marketing | marketing | marketing |
描述 | example term | example term edited | example term edited |
标记 | beta | beta | |
相关术语 | marketing>> 版本 | marketing>> 日期 | marketing>> 日期 |
分类 |
|
|
生成的草稿工件对原始值进行了以下更改:
- 原始描述将替换为新描述。
- 标记的原始空值将替换为值。
- 原始相关术语将替换为新的相关术语。
替换空值
原始工件的空值将替换为所导入工件的提供值。
例如,假设您有一个名为 release 的已发布业务术语,并导入 CSV 文件以进行修改。 下表显示了 替换空值 选项的效果:
属性 | 初始值 | CSV 文件中的值 | 生成的值 |
---|---|---|---|
名称 | 发行版 | 发行版 | 发行版 |
工件类型 | glossary_term | glossary_term | glossary_term |
类别 | marketing | marketing | marketing |
描述 | example term | example term edited | example term |
标记 | beta | beta | |
相关术语 | marketing>> 版本 | marketing>> 日期 | marketing>> 版本 |
分类 |
|
|
生成的草稿工件对原始值进行了此更改:
- 标记的原始空值将替换为值。
安全性注意事项
导出到 CSV 文件的监管数据将针对已知的 CSV 注入攻击进行清理,以确保自动解释 CSV 数据的电子表格程序安全。 因此,任何以下列其中一个字符开头的文本值:
- 等于 (=)
- 加号 (+)
- 减 (-)
- at (@)
以单引号字符 (') 作为前缀。 为了使功能一致,还会对导入的 CSV 文件进行额外解析,以自动除去单引号字符 (')。 在导入监管工件并将其导出到 ZIP 文件时,清理也适用,因为这些工件包含 CSV 文件。
要禁用此功能:
编辑IBM Knowledge Catalog词汇表 服务部署:
oc edit deployment wkc-glossary-service
将环境变量
ESCAPE_FORMULAS_IN_CSV_FILES
设置为值false
。
有关更多信息,请参阅 CSV 注入。
了解更多信息
父主题: 管理监管工件