Translation not up to date
您希望使用熟悉的电子表格环境来复审和管理单个元数据扩充作用域中数据资产的数据类和术语分配。
要求和限制
对于在电子表格中管理数据类和术语分配,存在以下需求和限制。
先决条件配置
复审元数据 Office 附加组件必须部署在您的组织中,并且您必须具有随该附加组件提供的 Microsoft Excel 工作簿模板的副本。
Microsoft 管理员可以从 IBM Knowledge Catalog 样本 GitHub 存储库中的 metadata-enrichment
文件夹下载 manifest.xml
文件和 Review metadata - IBM Knowledge Catalog.xlsx
工作簿模板,地址是:https://github.com/IBM/knowledge-catalog-samples
在清单文件和 Excel 模板随附的自述文件中提供了有关定制 manifest.xml
的指示信息。
管理员必须部署和发布附加组件,如 Microsoft 文档 部署和发布 Office 附加组件中所述。
您必须激活 复审元数据 Excel 插件。 有关如何执行此操作的信息,请检查适用于您的 Excel 版本的文档。
限制
在开始使用工作簿和附加组件之前,请查看 Microsoft Excel 附加组件的问题中的信息。
工作簿的外观
工作簿由 5 个受保护工作表组成:
工作表 | 内容 |
---|---|
数据资产 | 列: 连接 数据路径 数据资产 列 类型 描述 已分配/建议的数据类 数据类 已分配/建议的业务术语 业务术语列。 缺省情况下,提供了 3 列。 您可以添加更多列。 请参阅 查看和更新分配。 |
业务术语 | 列: Name Abbr。 为术语定义的缩写的列表。 类别路径 与众不同的名称。 如果存在多个同名的术语,那么此处列出了名称和类别路径以帮助区分这些术语。 描述 辅助类别 标记 分类 有效开始 有效结束 |
数据类 | 列: 名称 类别路径 与众不同的名称。 如果存在多个同名的数据类,那么此处会列出名称和类别路径,以帮助区分这些数据类。 描述 辅助类别 标记 分类 有效开始 有效结束 |
类别 | 列: 名称 路径 描述 标记 分类 |
Knowledge Catalog | 下载信息 上载信息 |
从 Cloud Pak for Data 检索数据
要将数据装入到工作簿中,请执行以下操作:
为要处理的每个元数据扩充项创建工作簿模板的副本。 为每个副本提供有意义的名称,例如,包含项目名称和元数据扩充项名称。 因此,您可以轻松识别数据所属的位置。
打开工作簿。 如果您已激活该加载项,Excel主页功能区将包含 "查看元数据"按钮)。如果没有看到该按钮,请按照适用于您的 Excel 版本的说明立即激活该加载项。
要打开附加组件任务窗格,请单击 复审元数据 按钮。
使用 Cloud Pak for Data 凭证登录。
检索监管工件和数据资产。 您可以在 2 单独的步骤中下载此信息。 但是,必须先下载监管工件,然后才能下载数据资产。 否则,无法显示分配。
检索监管工件
将Cloud Pak for Data中定义的所有数据类和业务术语的相关信息添加到工作簿的相应工作表中。 另外,添加有关数据类和术语所属类别的信息。
检索数据资产
选择项目和元数据扩充项,然后下载所选元数据扩充项作用域中的数据资产。 如果在项目列表中未看到新创建的项目,请重新装入该附加组件。
重要信息: 为了避免任何潜在的数据不匹配,请始终使用新的工作簿进行数据检索,即使您从先前处理的元数据扩充项中检索数据也是如此。
成功检索信息后,将使用以下信息填充 Knowledge Catalog 工作表:
- Cloud Pak for Data 主机名
- 项目的名称以及从中装入数据的元数据扩充项。 电子表格将始终反映初始检索时的显示名称。 当 IBM Knowledge Catalog中的项目名称或元数据丰富度发生变化时,它们不会更新。 但是,这不会影响上载时的更新,因为这些更新是使用不可改变的资源标识完成的。
- 下载监管工件和数据资产的日期和时间
此外,将在附加任务窗格中启用上载选项。
业务术语, 数据类和 类别 工作表包含 工作簿的外观中列出的信息。
数据资产 工作表包含数据资产的字母顺序列表,后跟所有列的字母顺序列表。 数据资产 工作表的列填充如下:
工作表列 | 可编辑 | 数据资产 | 资产列 |
---|---|---|---|
连接 | 否 | 连接名称 | 连接名称 |
数据路径 | 否 | 模式 | 模式 |
数据资产 | 否 | 资产名称 | 资产名称 |
列 | 否 | 列名 | |
Type | 否 | 设置为 数据集 | 设置为 字段 |
描述 | 是 | 可用于数据资产的任何描述 | 可能可用于资产列的任何描述 |
已分配/建议的数据类 | 否 | 已分配的数据类和建议的数据类 数据类 列中还列出了已分配的数据类。 |
已分配的数据类和建议的数据类 数据类 列中还列出了已分配的数据类。 |
数据类 | 对于数据资产 , "否" 表示资产列为 "是" |
已分配数据类 | 已分配数据类 |
已分配/建议的业务术语 | 否 | 分配的术语和建议的术语 分配的术语也列示在单独的 业务术语 列中。 |
分配的术语和建议的术语 分配的术语也列示在单独的 业务术语 列中。 |
业务术语 列数可能有所不同。 缺省值为 3 列。 如果数据资产或资产列分配了更多术语,那么将根据需要添加列。 您可以根据需要添加更多列。 请参阅 查看和更新分配。 |
是 | 已分配的术语 | 已分配的术语 |
复审和更新分配
要查看和更新元数据,请执行以下操作:
检查 数据类 和 业务术语 列。
保持正确的分配不变。 替换或除去不正确的分配。 对于业务术语,您可以根据需要添加任意数量的内容。 每个术语都必须位于单独的列中。 缺省情况下,工作表包含业务术语的 3 列。 您可以按如下所示添加额外的列:
- 取消保护 数据资产 工作表。
- 选择最后一个 业务术语 列。
- 右键单击该列中的任何位置,然后选择 插入。
- 可选: 添加列标题 业务术语。
- 再次保护工作表。
现在,您可以使用此新列来分配业务术语。
上载已复审的结果
完成复审后,将更新后的元数据上载到 Cloud Pak for Data。 您不必在开始上载之前保存工作簿。
上载的数据将覆盖项目中的扩充项结果。 所有之前分配的数据类别都将取消分配并标记为建议。 然后,按照电子表格中的规定更新数据类别和业务术语分配。 电子表格中的描述将覆盖项目中的资产和列描述。 所有列和资产都标记为已复审。
了解更多信息
父主题: 管理元数据扩充