您可以创建作业以在项目中的工具 (例如, Data Refinery 流, SPSS Modeler 流, Notebook 和脚本) 中运行资产或文件。
创建作业时,请在不同页面上定义作业的属性,例如名称,定义,环境运行时,调度和通知规范。 您可以立即运行作业,也可以等待作业在下一个调度的时间间隔运行。
每次启动作业时,都将创建作业运行,您可以监视该作业运行并将其与先前运行的作业运行历史记录进行比较。 您可以在作业运行日志中查看有关每个作业运行,作业状态更改和作业失败的详细信息。
创建作业的方式取决于资产或文件。
资产或文件 | 在工具中创建作业 | 从 "资产" 页面创建作业 | 自动创建作业 | 更多信息 |
---|---|---|---|---|
Data Refinery 流程 | ✓ | ✓ | 在 Data Refinery 中创建作业 | |
SPSS Modeler 流程 | ✓ | ✓ | 在 SPSS Modeler 中创建作业 | |
屏蔽流 | ✓ | 从 "资产" 页面创建屏蔽流作业 | ||
DataStage 流程 | ✓ | ✓ | ✓ | 在 DataStage 中创建作业 |
IBM Match 360 | ✓ | 在 IBM Match 360中创建作业 | ||
在 Notebook 编辑器中创建的 Notebook | ✓ | ✓ | 在 Notebook 编辑器中创建作业 | |
Metadata import | ✓ | Metadata import 作业 | ||
元数据扩充 | ✓ | 创建元数据丰富工作 | ||
数据质量规则 | ✓ | ✓ | ✓ | 创建用于运行数据质量规则的作业 |
管道 | ✓ | 为管道创建作业 |
自动创建作业
在项目中创建资产时,将自动创建某些作业。 这些作业列示在项目的 " 作业 " 页面上。 您可以查看作业运行详细信息,更改作业设置,手动运行作业以及从 "作业" 页面中删除作业。 请注意,无法从 " 作业 " 页面编辑元数据导入或元数据扩充作业的作业设置。 只能从项目的 " 资产 " 页面执行此操作。
将在以下情况下创建作业:
- DataStage 流。 请参阅在 DataStage 中创建作业。
- 数据质量规则的 DataStage 流。 请参阅 创建用于运行数据质量规则的作业。
- Metadata import 资产。 请参阅 Metadata import 作业。
- 元数据扩充资产。 请参见管理元数据充实工作。
从“资产”页面创建作业
您可以创建作业以从项目的 " 资产 " 页面运行资产。
- 所需许可权
- 您必须在项目中具有 编辑者 或 管理员 角色。
不能使用来自 服务标识的 API 密钥来运行作业。
要从项目的 " 资产 " 页面为列出的资产创建作业,请执行以下操作:
从 "资产类型 "部分选择资产,然后从菜单图标 "中选择 "新建任务",表格行末尾有选项列表。
输入名称和可选的描述,以定义作业详细信息。
如果可以选择 设置,请指定要用于作业的设置。
如果可以选择 配置,请为作业选择环境运行时。 根据资产类型,可以选择配置更多设置(例如环境变量或脚本自变量)。
为避免累积过多已完成的作业运行和作业运行工件,请设置保留已完成的作业运行和作业运行工件 (例如日志或 Notebook 结果) 的时间长度。 您可以选择要保留作业运行的天数或最后一个要保留的作业运行数。
在 " 调度 " 页面上,您可以选择添加一次性或重复调度。
如果选择值为 n的 重复 选项和 分钟 单位,那么作业将在小时开始时运行,然后在 n的每倍数运行。 例如,如果指定值 11 ,那么它将在每小时 0 , 11 , 22 , 33 , 44 和 55 分钟运行。
如果您还选择 调度开始 选项,那么作业将在您在 开始时间 字段中提供的时间之后的小时的前倍数 n 开始运行。 例如,如果输入 10:24 作为 开始时间 值,并选择 重复 并将作业设置为每 14 分钟重复一次,那么您的作业将在 1 0: 42 , 10:56 , 11:00 , 11:14 运行。 11:28 , 11:42 , 11:56 等等。
无法更改时区; 必须在 Web 浏览器的时区中设置作业调度。 调度将转换为运行作业的计算节点的时区。
如果排除特定工作日,那么该作业可能无法正常运行。 这是因为,创建该调度的用户在一个时区,运行该作业的计算节点在另一个时区。
注: 如果 Web 浏览器的时区设置为 "夏令时" (DST) 之后的本地时区,那么调度的作业可能会以不同方式显示。 例如,调度的作业显示在 3:00PM 东部标准时区 (EST) 每天对应于 8:00PM 全球标准时间 (UTC)。 当本地时区更改为东部夏令时时区 (EDT) 时,调度的作业将继续在 8:00PM (UTC) 运行,现在将显示为每天 4:00PM (EDT)。
在创建调度作业时生成 API 密钥,将来的运行将使用此 API 密钥。 如果未创建调度作业但选择修改该作业,那么当您修改该作业时将生成 API 密钥,并且将来的运行将使用此 API 密钥。(可选): 选择以查看作业的通知。 您可以选择要接收的警报类型。
复查作业设置。 然后,创建该作业并立即运行,或者创建该作业并稍后运行。
管理作业
您可以从项目的 " 作业 " 页面查看项目中存在的所有作业。 项目的管理员或编辑者角色可以查看和编辑作业详细信息。 您可以手动运行作业,并可以删除作业。 项目的查看者角色只能查看作业详细信息。 无法运行或删除具有 "查看者" 角色的作业。
要查看特定作业的详细信息,请单击该作业。 从作业的详细信息页面,您可以:
- 查看该作业的运行,以及每一次运行的状态。 如果运行失败,那么可以选中运行并查看日志尾或下载整个日志文件以帮助您对运行进行故障诊断。 运行失败的原因可能与临时连接问题或环境问题有关。 请尝试重新运行该作业。 如果该作业仍失败,那么您可将日志发送给客户支持人员。
- 通过单击 编辑作业来 编辑作业设置 ,例如,更改调度设置或选择其他环境模板。
- 单击作业操作栏中的运行图标 ",手动运行作业。 您可以根据调度和需求来启动调度作业。
- 单击作业操作栏中的删除",删除作业。
在工具中查看和编辑作业
您可以直接在以下工具中查看和编辑与资产关联的作业设置:
- Data Refinery
- DataStage
- Match 360
- Notebook 编辑器或查看器
- 管道
在 Data Refinery, Notebook 和 Pipeline 中查看和编辑作业
- 在该工具中,点击工具栏上的作业图标 ",然后选择 "保存并查看作业"。 此操作会列出该资产的现有作业。
- 选择作业以查看其详细信息。 您可以通过单击编辑作业来更改作业设置。
在 DataStage 中查看和编辑作业
要在 DataStage 流中查看或编辑运行时设置,请执行以下操作:
- 打开流程,点击设置图标 "。
- 在 " 设置 " 页面上单击 运行 。
在 IBM Match 360 中查看和编辑作业
要在 IBM Match 360中查看和管理作业:
从 Cloud Pak for Data 导航菜单中,选择 数据 > 主数据 以打开 IBM Match 360 服务。
转至 主数据主目录 ,然后打开 作业 选项卡。
作业 选项卡显示已在此 IBM Match 360 服务实例上运行或当前正在运行的作业的列表。 您可以查看详细信息,例如作业标识,作业类型,时间戳记信息和状态。 您还可以取消当前正在运行的任何作业。
或者,从任何主数据配置页面,单击操作栏中的流程图标 ",查看正在运行和最近完成的任务列表。
了解更多信息
- 在 Data Refinery 中创建作业
- 在 DataStage 中创建作业
- 使用 Data Privacy创建作业
- 在 IBM Match 360中创建作业
- 在 Notebook 编辑器或 Notebook 查看器中创建作业
- 创建用于运行数据质量规则的作业
- 创建元数据导入作业
- 管理元数据充实工作
- 为管道创建作业
父主题: 在项目中工作