配置并运行元数据扩充以向数据资产添加若干层元数据。
您可以创建数据概要文件以对数据资产进行分类,并编译有关其包含的值的统计信息。 使用 AI 为数据资产及其包含的列生成的备用列名和描述来扩充资产。 使用预定义的数据质量检查来对数据进行初始质量评估。 使用描述组织的数据语义的业务词汇表来扩充资产。 确定数据资产之间的关系。
您还可以使用 API 而不是用户界面来创建元数据扩充项。 这些 API 的链接在 了解更多信息 部分中列出。
要创建元数据扩充资产和用于扩充数据的作业,请执行以下操作:
打开一个项目并点击新资产 > 使用元数据丰富数据资产。 以此方式创建第一个元数据扩充项后,可以从项目的 " 资产 " 页面添加新的元数据扩充项资产。
定义详细信息:
- 指定元数据充实的名称。
- 可选:提供描述。
- 可选: 选择或创建要分配给元数据扩充资产的标记以简化搜索。 可通过输入标记名称并按 Enter 键来创建新标记。
设置初始数据作用域。
从数据资产中选择要充实的数据资产。 请参阅 初始数据范围 (Initial data scope)。 请先复审所选作用域,然后再继续。 可直接从数据作用域中删除资产,也可通过单击编辑数据作用域以重新处理整个作用域。
您可以跳过此步骤以创建空元数据扩充资产,并在稍后设置作用域。
定义此元数据扩充资产的目标。 您可以向数据资产添加若干层元数据:
- 对数据进行概要分析以对其进行分类,并编译有关值的统计信息。
- 添加备用名称和 AI 生成的描述。
- 使用描述组织的数据语义的业务词汇表来扩充资产。
- 对初始质量评估运行预定义的数据质量检查。
- 确定主键和键关系。
- 根据 SLA 规则评估数据质量
请参阅 扩充目标 (扩充目标)。
选择类别以确定可在扩充期间应用的业务词汇表。 请参阅 类别选择 (Category selection)。
选择采样类型。 请参阅 抽样 (抽样)。
定义浓缩任务的运行时间。 您可以随时手动运行浓缩。 参见运行定义。
选择扩充项的重新运行的数据作用域 (无论是已调度还是手动运行)。 请参阅 "丰富的重播范围"。
检查元数据充实配置。 要进行更改,请单击磁贴上的编辑图标 并更新设置。
单击创建。 将元数据丰富资产添加到项目中,并创建元数据丰富任务。 更多信息,请参阅管理增益工作。
根据运行定义的不同,可能会在创建元数据浓缩资产后立即运行浓缩。
扩充项完成后,您可以通过查看元数据扩充项资产来访问扩充项结果的高级概述。 从这里,您可以向下钻取并处理每个资产的结果。 请参阅 使用扩充项结果。
元数据扩充将在项目中可用的资产上运行。 因此,在以下情况下,扩充资产的列表可能与所配置的包含元数据导入资产的作用域不对应:
- Metadata import 在扩充项启动时尚未完成。
- Metadata import 对一组资产失败或完全失败。
在大量数据资产上运行元数据富集时,可能会出现对部分数据资产处理失败的情况。 对于无法丰富的每项资产,都会在元数据丰富任务的日志中写入错误信息,以便您识别这些资产。 然后,您可以对处理失败的资产重新运行浓缩。
有关如何更新,重新运行或删除元数据扩充项的信息,请参阅 管理现有元数据扩充项。
了解更多信息
后续步骤
父主题: 管理元数据扩充