作业是在watsonx.aiRuntime 中运行批量部署或脚本、笔记本、代码包或流程等独立资产的一种方式。 您可以选择作业的输入和输出,并选择手动或按调度运行该作业。 从部署空间中,可以创建,调度,运行和管理作业。
准备工作
为了提高运行部署工作的安全性,部署工作请求需要任务凭证。 要了解如何设置任务凭证和生成 API 密钥,请参阅 添加任务凭证。
- 您必须通过生成 API 密钥来设置任务凭证。 有关更多信息,请参阅管理任务凭证。
创建批处理部署作业
创建批处理部署作业时,请执行以下步骤:
- 从 部署 选项卡中,选择部署,然后单击 新建作业。 这样会打开 " 创建作业 " 对话框。
- 在 " 定义详细信息 " 部分中,输入作业名和可选描述,然后单击 下一步。
- 在 配置 部分中,选择硬件规范。 您可以执行以下步骤来 (可选) 配置环境变量和作业运行保留时间设置:
- 可选: 如果要部署 Python 脚本, R 脚本或 Notebook ,那么可以输入环境变量以将参数传递给作业。 单击 环境变量 以输入 键 - 值 对。
- 可选: 要避免通过保留所有历史作业元数据来完成资源,请遵循下列其中一个选项:
- 单击 按数量 以设置阈值,用于保存设置数量的作业运行和关联日志。
- 单击 按持续时间 (天) 以设置用于在指定天数内保存工件的阈值。
- 可选: 在 调度 部分中,切换 调度关闭 按钮以调度运行。 您可以为调度开始设置日期和时间,并为重复设置调度。 单击 下一步。
- 可选: 在 通知 部分中,切换 关闭 按钮以打开与此作业关联的通知。 单击 下一步。
- 在 选择数据 部分中,提供与模型模式对应的内联数据。 您可以使用表单在 JSON 表单器中提供输入。 单击下一步。 请参阅 内联数据的示例 JSON 有效内容。
- 在 复审并创建 部分中,验证作业详细信息,然后单击 创建并运行。
备注:
已调度的作业会显示在部署空间的作业选项卡上。
作业运行的结果将写入指定的输出文件并保存为空间资产。
数据资产可以是您提升到空间的数据源文件,已连接的数据源或数据库中的表以及基于文件的数据源中的文件。
如果在作业调度中排除某些工作日,那么作业可能无法按预期运行。 原因是创建调度的用户的时区与运行作业的主节点的时区之间存在差异。
创建或修改调度作业时,将生成 API 密钥。 未来运行将使用此生成的 API 密钥。
内联数据的示例 JSON 有效内容
{
"deployment": {
"id": "<deployment id>"
},
"space_id": "<your space id>",
"name": "test_v4_inline",
"scoring": {
"input_data": [{
"fields": ["AGE", "SEX", "BP", "CHOLESTEROL", "NA", "K"],
"values": [[47, "M", "LOW", "HIGH", 0.739, 0.056], [47, "M", "LOW", "HIGH", 0.739, 0.056]]
}]
}
}
排队和并发作业执行
每个部署的最大并发作业数由部署服务在内部处理。 对于批处理部署,缺省情况下可以同时运行两个作业。 针对已具有两个正在运行的作业的批处理部署的任何部署作业请求都将放在队列中以供稍后执行。 当任何正在运行的作业完成时,将运行队列中的下一个作业。 队列没有大小限制。
对批处理部署使用大型内联有效内容的限制
使用大型内联有效内容的批处理部署作业可能会陷入 starting
或 running
状态。 有关更多信息,请参阅 已知问题和限制。
部署作业元数据的保留
将持久存储与作业相关的元数据,并且可以访问这些元数据,直到删除该作业及其部署为止。
查看部署作业详细信息
创建或查看批处理作业时,将显示部署标识和作业标识。
- 部署标识表示部署定义,包括软硬件配置以及相关资产。
- 作业标识表示作业的详细信息,包括输入数据和输出位置以及用于运行作业的调度。
在watsonx.aiRuntimeData 和 AI Common Core API请求中,或在使用watsonx.ai Python客户端库的笔记本中,使用这些 ID 来引用作业。
父主题: 管理预测性部署