作业是在watsonx.aiRuntime 中运行批量部署、脚本或笔记本的一种方式。 您可以选择手动运行作业,也可以选择按您指定的调度运行作业。 创建一个或多个作业后,可以从部署空间的作业选项卡查看和管理这些作业。
从您空间的作业选项卡,您可以:
- 查看空间中的作业的列表
- 查看每个作业的详细信息。 您可以更改作业的调度设置并选取其他环境模板。
- 监视作业运行
- 删除作业
请参阅以下部分以了解作业管理的各个方面:
准备工作
您必须通过生成 API 密钥来设置任务凭证。 有关更多信息,请参阅管理任务凭证。
为批处理部署创建作业
要了解如何为批处理部署创建作业,请参阅 在批处理部署中创建作业。
查看空间中的作业
可以从“作业”页面查看部署空间中的所有作业。 您还可以删除作业。
要查看特定作业的详细信息,请单击该作业。 从作业的详细信息页面,您可以执行以下操作:
查看该作业的运行,以及每一次运行的状态。 如果运行失败,那么可以选中运行并查看日志尾或下载整个日志文件以帮助您对运行进行故障诊断。 运行失败的原因可能与临时连接问题或环境问题有关。 请尝试重新运行该作业。 如果该作业仍失败,那么您可将日志发送给客户支持人员。
作业正在运行时,信息页面上的进度指示器会显示有关运行的相对进度的信息。 您可以使用进度指示器来监视长期运行。
编辑调度设置或选择其他环境模板。
单击作业操作栏中的运行图标,以手动运行该作业。 必须取消选中调度才能手动运行作业。
管理作业元数据保留时间
与IBM Cloud帐户关联的watsonx.aiRuntime 计划对您可以创建的运行部署和存储部署的数量设置了限制。 如果超出限制,那么在删除现有部署或升级套餐之前,无法创建新部署。 更多信息,请参阅watsonx.ai运行时计划。
以编程方式管理元数据保留和删除
如果使用 Python 客户机或 REST API 以编程方式管理作业,那么可以在 30 天内使用 GET
方法从部署端点检索元数据。
要让元数据的保留时间长于或短于 30 天,请更改 POST
方法的查询参数缺省值 retention=30
,覆盖缺省值并保留元数据。
将值更改为 retention=-1
将取消自动删除并保留元数据。
要以编程方式删除作业,请为 "watsonx.aiRuntime "DELETE
方法指定查询参数 "hard_delete=true
,以完全删除作业元数据。
以下示例显示如何使用 DELETE
方法:
DELETE /ml/v4/deployment_jobs/{JobsID}
从样本中学习
请参阅 "机器学习示例和示例"(Machine learning sample and examples),查看示例笔记本的链接,这些笔记本演示了如何使用watsonx.ai Runtime REST API和watsonx.ai Python客户端库创建批量部署和作业。
父主题: 管理预测性部署