AutoAI 会自动准备数据,应用算法,并尝试构建最适合您的数据和用例的模型管道。 了解如何评估模型管道,以便可以将一个模型保存为模型。
复审试验结果
在 AutoAI 训练期间,数据集分割为训练部分和保持部分。 AutoAI 训练阶段使用训练部分来生成用于对其进行排名的 AutoAI 模型管道和交叉验证分数。 在 AutoAI 训练之后,保留部分将用于生成的管道模型评估和性能信息 (例如 ROC 曲线和混淆矩阵) 的计算,这些信息显示在排行榜中。 训练/保持部分的分割比率为 90/10。
随着训练的进行,系统会呈现动态信息图和排行榜。 将鼠标悬停在信息图中的节点上,以探索管道共享的因素及其唯一属性。 要获取信息图中数据的指南,请单击信息面板中的 "图注" 选项卡。 或者,要查看管道创建的其他视图,请单击通知面板的 "试验详细信息" 选项卡,然后单击 切换视图 以查看进度图。 在任一视图中,单击管道节点以在排行榜中查看关联的管道。 排行榜包含按交叉验证分数排名的模型管道。
查看管道变换
将鼠标悬停在信息图中的节点上,以查看管道的变换。 如果对管道执行了特征工程,那么数据变换序列由预处理变换器和数据变换器序列组成。 算法由 AutoAI 训练期间的模型选择和优化步骤确定。
请参阅实施详细信息,以复查有关创建管道的技术详细信息。
查看排行榜
将针对各种指标对每个模型管道进行评分,然后进行排名。 二元分类模型的缺省排名指标是 ROC 曲线下的区域。 对于多类分类模型,缺省度量是准确性。 对于回归模型,缺省度量是均方根误差 (RMSE)。 排名最高的管道显示在排行榜中,因此您可以查看有关它们的更多信息。 排行榜还提供了在您复审所选模型管道之后保存这些管道的选项。
您可以评估管道,如下所示:
- 在排行榜中单击管道,以查看有关指标和性能的更多详细信息。
- 单击 比较 以查看排名靠前的管道的比较方式。
- 按其他指标对排行榜进行排序。
查看混淆矩阵
对于用于二元分类试验的管道,您可以查看的其中一项详细信息是混淆矩阵。
混淆矩阵基于坚持数据,这是训练数据集中未用于训练模型管道但仅用于测量训练期间未看到的数据性能的部分。
在具有正类和负类的二元分类问题中,混淆矩阵总结了管道模型在四个象限中的正和负预测,这取决于它们与坚持数据集的正或负类标签相关的正确性。
例如, Bank 样本试验旨在识别接受向其提供的促销的客户。 排名最前的管道的混淆矩阵如下所示:
正类为 "yes" (表示用户接受促销)。 您可以看到真实负数 (即模型正确预测的客户将拒绝其促销) 的测量值很高。
单击导航菜单中的项,即可查看有关所选管道的其他详细信息。 例如,特征重要性会显示哪些数据特征对预测输出的影响最大。
将管道另存为模型
当您对管道感到满意时,请使用下列其中一种方法将其保存:
- 单击 保存模型 以将候选管道作为模型保存到项目中,以便您可以对其进行测试和部署。
- 单击 另存为 Notebook 以创建自动生成的 Notebook 并将其保存到项目中。 您可以在 Notebook 中查看代码或运行试验。
后续步骤
将经过训练的模型提升到部署空间,以便可以使用新数据来测试该模型并生成预测。
了解更多信息
父主题: AutoAI 概述