0 / 0
Go back to the English version of the documentation
创建元数据导入
Last updated: 2024年12月13日
创建元数据导入

您可以导入技术元数据和世系元数据,将数据资产添加到项目或目录中。 在项目中,您可以在将数据发布到目录之前对其进行准备和分析。

将元数据作为数据资产导入项目,以便在将数据发布到目录之前对其进行准备和分析。 通过运行元数据充实,对此类数据资产进行剖析,分析数据质量,并分配术语以提供业务上下文。 要进行更深入的质量分析,可在数据资产上运行数据质量规则。 如果数据无需进一步准备即可共享,也可以直接将数据资产添加到目录中。 导入脉络元数据,查看数据的来源、变化和流向。

支持的连接
请参阅支持的连接器中的Metadata import栏。 您可以使用 API 而不是用户界面来检索支持的连接列表或创建元数据导入资产。 更多信息 "部分列出了这些应用程序接口的链接。
所需许可权
要创建、管理和运行元数据导入,您必须拥有这些角色和权限:
  • 项目中的管理员编辑角色。
  • 要导入或发布资产的目录中的管理员编辑器角色。
  • 访问要导入的数据资产的数据源连接,以及相应数据库的 SELECT 或类似权限。
  • 管理数据脉络权限,以导入脉络元数据。

先决条件

在开始为新数据源创建元数据导入之前,请完成以下步骤:

  1. 创建数据源定义
  2. 在项目中创建与数据源的连接

每个数据源都需要不同的连接细节。 您可以在连接器部分的每个连接主题中找到这些信息。 有关元数据导入中数据源定义和连接的更多信息,请参阅设计元数据导入:数据源

创建元数据导入资产并导入元数据

创建元数据导入资产和将元数据导入项目或目录的任务:

  1. 打开一个项目,进入项目的 "资产"页面,然后单击 "新建资产">"为数据资产导入元数据"。

  2. 指定元数据导入的名称。 (可选)您可以提供描述。

  3. 选择要分配给元数据导入资产的标签,以简化搜索。 输入标签名称即可创建新标签。

  4. 选择导入目标。 您可以选择一个或两个目标。 参见 "进口目标"。

  5. 如果选择了导入资产元数据目标,请选择导入目标。 你可以将元数据导入你正在处理的项目,或者导入到你拥有编辑或管理角色的任何目录中。 请参见导入目标

  6. 提供元数据导入数据源的详细信息。 导入世系元数据时需要定义数据源。 导入资产元数据时,可选择数据源定义或连接。 根据数据源的不同,您可能还需要选择扫描仪。 参见数据来源

  7. 定义元数据导入的作用域。 见进口范围。 根据数据源的大小和内容,您可能不希望导入所有资产,而只是导入其中一部分。 可以包含完整的模式或文件夹,或者向下钻取到各个表或文件。 选择某个模式或文件夹时,可以立即看到其中包含的项数。 因此,您可以决定是要包含整个集合,还是其中一部分能更好地满足您的需要。

    导入世系元数据时,可以通过以下方式更改数据范围:

    • 选择数据源中的特定对象,例如模式或报告。
    • 在 .zip 文件中添加外部输入,其中包含更多与血统相关的数据。
    • 从文件系统或Git仓库添加元数据。

    您还可以选择为外部输入定义占位符替换,以便更好地进行世系分析。 单击 "配置"并定义详细信息。 请参见占位符替换

  8. 定义是否要运行调度的导入作业。 如果不设置日程,则会在保存元数据导入资产时运行导入。 随时可以手动重新运行导入。 请参阅日程安排选项

  9. 如果导入了世系元数据,就可以决定运行哪个世系阶段。 请参见血统导入阶段

  10. 自定义导入行为 您可以选择阻止更新特定属性,也可以删除不包括在重新导入中的现有资产。 请参阅高级导入选项

  11. 复查元数据导入配置。 要进行更改,请单击磁贴上的编辑图标 "编辑图标并更新设置。

  12. 单击创建。 将元数据导入资产添加到项目中,并创建元数据导入任务。 如果没有配置日程表,则会立即运行导入。 如果您配置了日程表,导入将按照定义的日程表运行。

    重要提示:同一连接中已通过不同元数据导入的资产不会被重新导入,但会被更新。 此类资产不再显示在初始元数据导入中。 只有最近运行的元数据导入才包含资产。

根据元数据导入任务的运行结果,将显示完成信息或错误通知。

当作业运行成功完成、有警告完成或有错误完成时,将显示完成信息。 如果整个作业运行失败,则会显示错误通知。 无论哪种通知类型,都包含一个作业运行日志链接,提供有关特定作业运行的详细信息。

导入完成后,您可以看到资产列表,其中包含以下信息:

  • 资产名称,为项目或目录中的资产提供链接。
  • 资产类型,如DataReport。 对于数据资产,还会显示格式,如Relational table。 对于其他资产类型,格式栏显示破折号 (-)。
  • 资产上下文,如父或文件路径。
  • 上次导入资产的日期和时间。
  • The import status, which can be Imported for successfully imported data, In progress, or Removed if the asset couldn't be reimported.

您可以用与连接数据资产相同的方式处理大多数导入的数据资产。 导入的资产会自动分配一个标签,以反映资产的父资产(如适用)。

要对导入的数据资产进行剖析、分析并提供业务上下文,可创建元数据丰富资产并将元数据导入资产包含在数据范围中。

了解更多信息

后续步骤

父主题: 导入元数据

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more