0 / 0
Go back to the English version of the documentation
运行屏蔽流程作业
Last updated: 2025年1月28日
运行屏蔽流程作业

在屏蔽流作业中,数据用户定义屏蔽数据副本的目标位置。 可以调度作业,成功完成作业后,可以查看作业报告摘要。

有两种方法可以创建屏蔽流作业:

  • 创建屏蔽流后,单击 配置作业
  • 单击单个数据资产上的 选项 菜单以跳过创建屏蔽流并直接为该数据资产配置屏蔽作业。
注: 在屏蔽流作业期间,如果没有足够的内存来支持该作业,那么可能会发生错误。 为避免错误,数据的最大大小不能大于 12GBs。

创建遮罩流环境

必需的许可权

要创建环境模板,必须满足以下两个条件:

  • 您必须在项目中拥有管理员编辑的角色。
  • 您必须属于项目创建者的 IBM Cloud 账户。

为您的项目创建环境模板:

  1. 在您的项目中,点击 “管理”选项卡 ,然后点击 “环境”页面
  2. 从“环境”页面,点击 “模板”选项卡 ,然后点击 “新建模板 ”。
  3. 请输入名称和描述(可选)来定义环境详情。
  4. 类型下 ,点击火花塞
  5. 硬件配置下 ,根据掩蔽流程作业中表格的大小指定驱动程序和执行程序配置。
  6. “执行者数量”下 ,增加执行者数量,以在作业配置为分区运行时提高屏蔽流的性能。 更多信息,请参阅 “管理工作绩效”主题中的 “最佳实践”部分
  7. 软件版本列表中选择 “掩蔽流火花 ”。
  8. 单击创建

使用作业

要配置作业:

  1. 输入作业的名称并添加作业的可选描述。
  2. 添加要在其中插入掩码数据副本的目标连接。 源连接用于读取数据。
  3. 单击 + 以添加新连接。 模式将源表映射到目标表。 必须已在目标模式中配置表定义。
提示: 当源资产为 Apache Hive时,请使用 Apache HDFS 作为目标连接。
  1. (可选)在“分区”页面中,您可以选择编辑资产的分区详情:
    • 如果您使用 “设置采样” 创建遮罩流 ,则可以安全地忽略编辑“分区”页面,只需将 “编辑分区详细信息” 设置为“关闭” 即可。
    • 如果您的表格包含大量数据,请考虑通过指定一列作为分区列来编辑分区详细信息。 为了提高工作效率,您可以增加分区数量。 更多信息,请参阅 “管理工作绩效”主题中的 “最佳实践”部分
  2. (可选) 调度作业或调度重现作业。
  3. 复审并运行作业。

了解更多信息

父主题: 使用屏蔽流屏蔽数据