您可以导入技术元数据和世系元数据,将数据资产添加到项目或目录中。 在项目中,您可以在将数据发布到目录之前对其进行准备和分析。
将元数据作为数据资产导入项目,以便在将数据发布到目录之前对其进行准备和分析。 通过运行元数据充实,对此类数据资产进行剖析,分析数据质量,并分配术语以提供业务上下文。 要进行更深入的质量分析,可在数据资产上运行数据质量规则。 如果数据无需进一步准备即可共享,也可以直接将数据资产添加到目录中。 导入脉络元数据,查看数据的来源、变化和流向。
- 支持的连接
- 请参阅支持的连接器中的Metadata import栏。 您可以使用 API 而不是用户界面来检索支持的连接列表或创建元数据导入资产。 更多信息 "部分列出了这些应用程序接口的链接。
- 所需许可权
- 要创建、管理和运行元数据导入,您必须拥有这些角色和权限:
- 项目中的管理员或编辑角色。
- 要导入或发布资产的目录中的管理员或编辑器角色。
- 访问要导入的数据资产的数据源连接,以及相应数据库的 SELECT 或类似权限。
- 管理数据脉络权限,以导入脉络元数据。
先决条件
在开始为新数据源创建元数据导入之前,请完成以下步骤:
每个数据源都需要不同的连接细节。 您可以在连接器部分的每个连接主题中找到这些信息。 有关元数据导入中数据源定义和连接的更多信息,请参阅设计元数据导入:数据源。
创建元数据导入资产并导入元数据
创建元数据导入资产和将元数据导入项目或目录的任务:
打开一个项目,进入项目的 "资产"页面,然后单击 "新建资产">"为数据资产导入元数据"。
指定元数据导入的名称。 (可选)您可以提供描述。
选择要分配给元数据导入资产的标签,以简化搜索。 输入标签名称即可创建新标签。
选择导入目标。 您可以选择一个或两个目标。 参见 "进口目标"。
如果选择了导入资产元数据目标,请选择导入目标。 你可以将元数据导入你正在处理的项目,或者导入到你拥有编辑或管理角色的任何目录中。 请参见导入目标。
提供元数据导入数据源的详细信息。 导入世系元数据时需要定义数据源。 导入资产元数据时,可选择数据源定义或连接。 根据数据源的不同,您可能还需要选择扫描仪。 参见数据来源。
定义元数据导入的作用域。 见进口范围。 根据数据源的大小和内容,您可能不希望导入所有资产,而只是导入其中一部分。 可以包含完整的模式或文件夹,或者向下钻取到各个表或文件。 选择某个模式或文件夹时,可以立即看到其中包含的项数。 因此,您可以决定是要包含整个集合,还是其中一部分能更好地满足您的需要。
导入世系元数据时,可以通过以下方式更改数据范围:
- 选择数据源中的特定对象,例如模式或报告。
- 在 .zip 文件中添加外部输入,其中包含更多与血统相关的数据。
- 从文件系统或Git仓库添加元数据。
您还可以选择为外部输入定义占位符替换,以便更好地进行世系分析。 单击 "配置"并定义详细信息。 请参见占位符替换。
定义是否要运行调度的导入作业。 如果不设置日程,则会在保存元数据导入资产时运行导入。 随时可以手动重新运行导入。 请参阅日程安排选项。
如果导入了世系元数据,就可以决定运行哪个世系阶段。 请参见血统导入阶段。
自定义导入行为 您可以选择阻止更新特定属性,也可以删除不包括在重新导入中的现有资产。 请参阅高级导入选项。
复查元数据导入配置。 要进行更改,请单击磁贴上的编辑图标 "并更新设置。
单击创建。 将元数据导入资产添加到项目中,并创建元数据导入任务。 如果没有配置日程表,则会立即运行导入。 如果您配置了日程表,导入将按照定义的日程表运行。
重要提示:同一连接中已通过不同元数据导入的资产不会被重新导入,但会被更新。 此类资产不再显示在初始元数据导入中。 只有最近运行的元数据导入才包含资产。
根据元数据导入任务的运行结果,将显示完成信息或错误通知。
当作业运行成功完成、有警告完成或有错误完成时,将显示完成信息。 如果整个作业运行失败,则会显示错误通知。 无论哪种通知类型,都包含一个作业运行日志链接,提供有关特定作业运行的详细信息。
导入完成后,您可以看到资产列表,其中包含以下信息:
- 资产名称,为项目或目录中的资产提供链接。
- 资产类型,如
Data
或Report
。 对于数据资产,还会显示格式,如Relational table
。 对于其他资产类型,格式栏显示破折号 (-)。 - 资产上下文,如父或文件路径。
- 上次导入资产的日期和时间。
- The import status, which can be
Imported
for successfully imported data,In progress
, orRemoved
if the asset couldn't be reimported.
您可以用与连接数据资产相同的方式处理大多数导入的数据资产。 导入的资产会自动分配一个标签,以反映资产的父资产(如适用)。
要对导入的数据资产进行剖析、分析并提供业务上下文,可创建元数据丰富资产并将元数据导入资产包含在数据范围中。
了解更多信息
后续步骤
父主题: 导入元数据