Go back to the English version of the documentation运行屏蔽流程作业
运行屏蔽流程作业
Last updated: 2025年1月28日
在屏蔽流作业中,数据用户定义屏蔽数据副本的目标位置。 可以调度作业,成功完成作业后,可以查看作业报告摘要。
有两种方法可以创建屏蔽流作业:
- 创建屏蔽流后,单击 配置作业。
- 单击单个数据资产上的 选项 菜单以跳过创建屏蔽流并直接为该数据资产配置屏蔽作业。
注: 在屏蔽流作业期间,如果没有足够的内存来支持该作业,那么可能会发生错误。 为避免错误,数据的最大大小不能大于 12GBs。
创建遮罩流环境
必需的许可权
要创建环境模板,必须满足以下两个条件:
- 您必须在项目中拥有管理员或编辑的角色。
- 您必须属于项目创建者的 IBM Cloud 账户。
为您的项目创建环境模板:
- 在您的项目中,点击 “管理”选项卡 ,然后点击 “环境”页面。
- 从“环境”页面,点击 “模板”选项卡 ,然后点击 “新建模板 ”。
- 请输入名称和描述(可选)来定义环境详情。
- 在类型下 ,点击火花塞。
- 在硬件配置下 ,根据掩蔽流程作业中表格的大小指定驱动程序和执行程序配置。
- 在 “执行者数量”下 ,增加执行者数量,以在作业配置为分区运行时提高屏蔽流的性能。 更多信息,请参阅 “管理工作绩效”主题中的 “最佳实践”部分。
- 从软件版本列表中选择 “掩蔽流火花 ”。
- 单击创建。
使用作业
要配置作业:
- 输入作业的名称并添加作业的可选描述。
- 添加要在其中插入掩码数据副本的目标连接。 源连接用于读取数据。
- 单击 + 以添加新连接。 模式将源表映射到目标表。 必须已在目标模式中配置表定义。
提示: 当源资产为 Apache Hive时,请使用 Apache HDFS 作为目标连接。
- (可选)在“分区”页面中,您可以选择编辑资产的分区详情:
- 如果您使用 “设置采样” 创建遮罩流 ,则可以安全地忽略编辑“分区”页面,只需将 “编辑分区详细信息” 设置为“关闭” 即可。
- 如果您的表格包含大量数据,请考虑通过指定一列作为分区列来编辑分区详细信息。 为了提高工作效率,您可以增加分区数量。 更多信息,请参阅 “管理工作绩效”主题中的 “最佳实践”部分。
- (可选) 调度作业或调度重现作业。
- 复审并运行作业。
了解更多信息
父主题: 使用屏蔽流屏蔽数据