您可以查看和运行内置样本管道,该管道使用样本数据来了解如何在编排管道中自动执行机器学习流。
样本管道中发生了什么?
样本管道获取训练数据,使用 AutoAI 工具训练机器学习模型,并选择要另存为模型的最佳管道。 然后,会将模型复制到部署该模型的部署空间。
该样本说明了如何使端到端流程自动化,从而使生命周期更易于运行和监控。
样本管道如下所示:
本教程将指导您完成以下过程:
先决条件
要运行此样本,必须首先创建:
预览创建和运行样本管道
观看此视频以了解如何创建和运行样本管道。
此视频提供了一种可视方法来学习本文档中的概念和任务。
创建样本管道
在 "管道" 编辑器中创建样本管道。
打开要创建管道的项目。
来自资产选项卡,点击新资产 > 自动化模型生命周期。
单击 资源中心样本 选项卡,然后选择 编排 AutoAI 试验。
输入管道的名称。 例如,输入 Bank marketing sample。
单击 创建 以打开画布。
运行样本管道
要运行样本管道:
单击画布工具栏上的 运行管道 ,然后选择 试用运行。
提示为 deployment_space 管道参数提供值时,请选择部署空间。
单击 选择空间。
展开 空间 部分。
选择部署空间。
单击 选择。
如果是首次运行管道,请提供 API 密钥。 管道资产使用您的个人 IBM Cloud API 密钥来安全地运行操作,而不会造成中断。
如果您有现有 API 密钥,请单击 使用现有 API 密钥,粘贴 API 密钥,然后单击 保存。
如果您没有现有 API 密钥,请单击 生成新的 API 密钥,提供名称,然后单击 保存。 复制 API 密钥,然后保存 API 密钥以供将来使用。 完成后,单击 关闭。
单击运行以启动管道。
查看结果
管道运行完成后,您可以查看输出以查看结果。
打开指定为管道一部分的部署空间。 您将在空间中看到新部署:
如果要测试部署,请使用部署空间的 " 测试 " 页面以 JSON 格式提交有效内容数据并返回分数。 例如,单击 JSON 选项卡并输入以下输入数据:
{"input_data": [{"fields": ["age","job","marital","education","default","balance","housing","loan","contact","day","month","duration","campaign","pdays","previous","poutcome"],"values": [["30","unemployed","married","primary","no","1787","no","no","cellular","19","oct","79","1","-1","0","unknown"]]}]}
单击 预测时,模型会生成具有置信度分数的输出,用于预测客户是否预订定期存款促销。
在这种情况下, "否" 的预测伴随着接近 95% 的置信度分数,预测客户极有可能不会预订定期存款。
浏览样本节点和配置
通过以下步骤,更深入地了解样本节点如何配置为在管道样本中协同工作。
查看管道参数
管道参数指定整个管道的设置。 在样本管道中,管道参数用于指定用于存储和部署从 AutoAI 试验保存的模型的部署空间。 系统会提示您选择管道参数链接到的部署空间。
单击画布工具栏上的 "全局对象" 图标 以查看或创建管道参数。 在样本管道中,管道参数命名为 deployment_space,其类型为 Space。 单击管道参数的名称以查看详细信息。 在此样本中,管道参数将与创建数据文件节点和创建 AutoAI 试验节点配合使用。
装入 AutoAI 试验的训练数据
在此步骤中,创建数据文件节点配置为访问试验的数据集。 单击该节点以查看配置。 数据文件为 bank-marketing-data.csv
,提供样本数据以预测银行客户是否注册定期存款。 数据位于 Cloud Object Storage 存储区中,可进行刷新以使模型训练保持最新。
选项 | 值 |
---|---|
文件 | 用于训练 AutoAI 试验的数据资产的位置。 在这种情况下,数据文件位于项目中。 |
文件路径 | 资产的名称 bank-marketing-data.csv 。 |
目标作用域 | 对于此样本,目标是部署空间。 |
创建 AutoAI 试验
使用以下值配置创建 AutoAI 试验节点:
选项 | 值 |
---|---|
AutoAI 试验名称 | onboarding-bank-marketing-prediction |
作用域 | 对于此样本,目标是部署空间。 |
预测类型 | 二进制 |
预测列(标签) | y |
阳性类 | 是 |
训练数据拆分比 | 0.9 |
要包括的算法 | 梯度提升分类器估计器 XGB分类器估计器 |
要使用的算法 | 1 |
要优化的度量 | ROC AUC |
优化度量 (可选) | 缺省值 |
硬件规格(可选) | 缺省值 |
AutoAI 试验描述 | 此试验使用样本文件,其中包含从对葡萄牙银行的电话呼叫中收集以响应市场营销活动的文本数据。 分类目标是预测客户是否预订由变量 y 表示的定期存款。 |
AutoAI 实验标记 (可选) | 无 |
创建方式 (可选) | 缺省值 |
这些选项定义了一个试验,此试验使用银行市场营销数据来预测客户是否有可能参加促销活动。
运行 AutoAI 试验
在此步骤中,运行 AutoAI 试验节点将运行 AutoAI 试验 onboarding-bank-marketing-prediction,训练管道,然后保存最佳模型。
选项 | 值 |
---|---|
AutoAI 试验 | 将 Create AutoAI 节点的输出作为运行试验的输入。 |
训练数据资产 | 将 创建数据文件 节点的输出作为试验的训练数据输入。 |
模型计数 | 1 |
模型计数 (可选) | 3 |
保留数据资产 (可选) | 无 |
运行名称 (可选) | 无 |
模型名称前缀 (可选) | 无 |
运行描述 (可选) | 无 |
运行标记 (可选) | 无 |
创建方式 (可选) | 缺省值 |
错误策略 (可选) | 缺省值 |
将模型部署到 Web 服务
创建 Web 部署 节点将创建名为 onboarding-bank-marketing-prediction-deployment 的联机部署,以便您可以从 REST API 端点实时交付数据和获取预测。
选项 | 值 |
---|---|
ML 资产 | 采用 Run AutoAI 节点的最佳模型输出作为创建部署的输入。 |
部署名称 | onboarding-bank-marketing-prediction-deployment |