使用样本数据来训练多变量时间序列实验,该实验借助影响预测字段的支持功能来预测污染率和温度。
设置实验时,将装入跟踪 2010 年至 2014 年北京天气状况的样本数据。 该实验生成了一组管道,这些管道使用算法来预测未来的污染和温度,具有支持功能,包括露水,压力,雪和雨水。 生成管道后,AutoAI 将比较和测试这些管道,选择性能最佳的管道,并在排行榜中显示这些管道以供您查看。
准备工作
确保提供了以下服务:
- watsonx.ai工作室服务
- Watson Machine Learning 服务
数据集概述
本教程使用资源中心的北京 PM2.5数据集。 此数据集描述 2010 年至 2014 年北京的天气状况,以 1 天的步骤或增量进行度量。 您可以使用此数据集来配置 AutoAI 试验并选择 "支持" 功能部件。 此处描述了有关数据集的详细信息:
- 除日期列以外的每一列都表示影响污染指数的天气状况。
- 资源中心条目显示数据的来源。 您可以先预览该文件,然后再下载该文件。
- 样本数据以行和列为结构,并保存为 .csv 文件。
任务概述
在本教程中,您将遵循以下步骤来创建使用支持功能的多变量时间序列试验:
创建项目
按照以下步骤创建一个空项目,并从Cloud Pak for Data as a Service资源中心下载北京 PM2.5数据集:
- 从主导航窗格中,单击 项目 > 查看所有项目,然后单击 新建项目。
a. 单击 创建空项目。
b. 输入项目的名称和可选描述。
c. 单击创建。 - 从主导航面板点击资源中心,下载北京 PM2.5数据集的本地副本。
创建 AutoAI 试验
执行以下步骤以创建 AutoAI 试验并向该试验添加样本数据:
在资产选项卡中,点击新资产 > 自动构建机器学习模型。
指定试验的名称和可选描述。
将机器学习服务实例与试验相关联。
选择 8 vCPU 和 32 GB RAM 的环境定义。
单击创建。
要添加样本数据,请选择下列其中一种方法:
- 如果在本地下载了文件,请通过单击 浏览 ,然后遵循提示来上载训练数据文件 PM25.csv 。
- 如果已将文件上载到项目,请单击 从项目中选择,然后选择 数据资产 选项卡,然后选择 北京 PM 25.csv。
配置试验
遵循以下步骤来配置多变量 AutoAI 时间序列试验:
针对该选项单击是以创建时间序列预测。
选择为预测列:
pollution
,temp
。选择作为日期/时间列:
date
。单击 试验设置 以配置试验:
a。 在 " 预测 " 页面中,接受要包含的算法的缺省选择。 允许使用 "支持功能 "的算法在 "允许支持功能"栏中用复选标记表示。
'b. 转至 " 数据源 " 页面。 对于本教程,您将在测试时提供支持功能部件的未来值。 当支持特征的值对于预测范围可知时,未来值很有用。 接受 利用支持功能部件的未来值的缺省启用。 此外,接受将用作支持特征的列的默认选择。
c. 单击 取消 以退出实验设置。单击运行试验以开始训练。
复审实验结果
实验需要几分钟才能完成。 在试验训练时,关系图将显示用于创建管道的变换。 执行以下步骤以查看试验结果并以最佳性能保存管道。
可选: 将其悬浮在关系映射中的任何节点上,以获取有关特定管道的变换的详细信息。
可选: 在排行榜上列出管道后,单击 管道比较 以查看它们之间的差异。 例如:
完成训练后,将性能排名前三的管道保存到排行榜。 单击任何管道名称以查看详细信息。
注: 使用支持功能的管道由 **SUP* * 增强功能指示。选择具有排名 1 的管道,然后单击 另存为 以创建模型。 然后,单击创建。 此操作会将管道保存在 资产 选项卡中的 模型 部分下。
部署经过训练的模型
要使用经过训练的模型来根据新数据进行预测,必须先部署该模型。 执行以下步骤以将经过训练的模型提升到部署空间:
- 您可以从 模型详细信息 页面部署模型。 要访问 " 模型详细信息 " 页面,请选择下列其中一个选项:
- 在保存模型时显示的通知中单击模型的名称。
- 打开包含模型的项目的 " 资产 " 页面,然后在 Machine Learning 模型 部分中单击模型的名称。
- 单击 "推广到部署空间'"图标,然后选择或创建部署模型的部署空间。
可选: 遵循以下步骤来创建部署空间:
a. 从 "目标空间" 列表中,选择 创建新的部署空间。
b. 输入部署空间的名称。
c. 要关联机器学习实例,请转至 选择机器学习服务 (可选) ,然后从列表中选择机器学习实例。
d. 单击创建。 - 选择或创建空间后,单击 提升。
- 单击通知中的部署空间链接。
- 从部署空间的 资产 选项卡:
a. 将鼠标悬停在模型名称上,然后点击部署图标 "。
b. 在打开的页面中,填写以下字段:
-选择 联机 作为部署类型。
-指定部署的名称。
-单击 创建。
部署完成后,单击 部署 选项卡,然后选择部署名称以查看详细信息页面。
测试已部署的模型
执行以下步骤以从 "部署详细信息" 页面测试已部署的模型:
在 "部署详细信息" 页面的 测试 选项卡上,转至 新观察值 (可选) 电子表格并输入以下值:
污染 (双精度值):80.417
临时 (双精度值):-5.5
露 (双):-7.083
按 (双):1020.667
wnd_spd (双):9.518
雪 (双):0
雨 (双):0
要添加支持功能部件的未来值,请转至 未来外部功能部件 (可选) 电子表格,并输入以下值:
露 (双):-12.667
按 (双):1023.708
wnd_spd (双):9.518
雪 (双):0
rain (双):0.042
注: 必须为未来的外源特征提供与您在试验配置阶段设置的预测水平相同的值数。单击 预测。 生成的预测指示污染和温度的值。
注: 测试部署时,输出中显示的预测值可能有所不同。
了解更多信息
父主题: 建立时间序列实验