0 / 0
Go back to the English version of the documentation
构建 AutoAI 模型
Last updated: 2024年11月07日
构建 AutoAI 模型

AutoAI 会自动准备数据,应用算法并构建最适合您的数据和用例的模型管道。 了解如何生成可另存为机器学习模型的模型管道。

请遵循以下步骤来上载数据,并使 AutoAI 针对您的数据和用例创建最佳模型。

  1. 收集输入数据
  2. 打开 AutoAI 工具
  3. 指定模型和训练数据的详细信息并启动 AutoAI
  4. 查看结果

收集输入数据

收集并准备训练数据。 有关允许的数据源的详细信息,请参阅 AutoAI 概述

注:

如果要使用单个训练数据源创建试验,那么可以选择使用第二个数据源专门作为测试或 保留数据来验证管道。

打开 AutoAI 工具

为方便起见, AutoAI 模型创建使用与项目关联的缺省存储器来存储数据和保存模型结果。

  1. 打开项目。

  2. 单击“资产”选项卡

  3. 点击新资产 > 自动构建机器学习模型

笔记:创建AutoAI它会在项目的“资产”页面上显示**AutoAI实验**部分,以便您可以返回到该部分。

指定试验的详细信息

  1. 指定试验的名称和描述。

  2. 选择机器学习服务实例,并按提示提供任务凭证。 然后点击创建

  3. 从项目中选择数据,或者从文件系统或资产浏览器上载数据,然后按继续。 单击“预览”图标以复查数据。 (可选) 添加第二个文件作为用于测试经过训练的管道的保留数据。

  4. 针对想要试验预测的数据选择要预测的列

    • 根据对数据集子集的分析, AutoAI 选择缺省模型类型: 二元分类,多类分类或回归。 如果目标列具有两个可能的值,那么将选择二进制。 多类具有一组离散的 3 或更多值。 回归在目标列中具有连续数字变量。 您可以选择覆盖此选择。

      注: 要分类的值的限制为 200。 在预测列中创建具有许多唯一值的分类实验是资源密集型的,会影响实验的性能和训练时间。 要保持试验的质量:
      - AutoAI 选择用于优化的缺省度量。 例如,二元分类模型的缺省度量是 *Accuracy *。
      -缺省情况下,保留 10% 的训练数据以测试模型的性能。
  5. (可选): 单击 试验设置 以查看或定制 AutoAI 运行的选项。 有关试验设置的详细信息,请参阅 配置分类或回归试验

  6. 单击运行试验以开始创建模型管道。

信息图显示数据的管道创建。 此阶段的持续时间取决于数据集的大小。 如果处理时间非常短暂或者需要更多时间,通知消息将通知您。 管道构建期间,您可以使用产品的其他部分。

AutoAI 生成的管道的关系图

将鼠标悬停在信息图中的节点上,以探索管道共享的因素及其唯一属性。 您可以查看管道共享的因素以及使管道唯一的属性。 要获取信息图中数据的指南,请单击信息面板中的 "图注" 选项卡。 或者,要查看管道创建的不同视图,请单击通知窗格的“试验详细信息”选项卡,然后单击切换视图以查看进度图。 在任一视图中,单击管道节点以在排行榜中查看关联的管道。

查看结果

管道生成过程完成后,您可以在将管道另存为模型之前查看已排名的模型候选者并对其进行评估。

后续步骤



父主题: AutoAI 概述

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more