0 / 0
Go back to the English version of the documentation
自动资料准备节点
Last updated: 2024年10月07日
"自动数据准备" 节点 (SPSS Modeler)

准备数据以进行分析是任何项目中最重要的步骤之一,而从传统上说也是最耗时的步骤之一。 “自动化资料准备 (ADP)”为您处理任务,分析您的数据并识别修正,筛选出存在问题或可能无用的字段,并在适当的情况下派生新的属性,通过智能筛选技术改进性能。 您可以通过完全自动的方式使用算法,这种方式可以允许选择并应用修正;或者也可以通过交互式方式使用算法,这种方式可以在做出更改前对其进行预览,并根据需要进行接受或拒绝。

通过使用 ADP,您可以快速、轻松地准备数据以供建模,而无需具备相关统计概念的预备知识。 模型将更快速地构建和评分

注:当 ADP 准备字段进行分析时,它将创建包含调整或转换的新字段,而不是替换旧字段的现有值和属性。 旧字段未用于进一步分析;其角色设置为“无”。

示例。 在调查业主保险理赔方面拥有有限资源的保险公司希望构建一个模型来标记具有潜在欺骗性的可疑理赔。 构建模型前,他们将使用自动化资料准备来准备数据进行建模。 由于他们希望能够在应用变换前查看建议的变换,他们将在交互模式下使用自动化资料准备。

某汽车集团希望跟踪各类私人汽车的销售情况。 为了能够标识表现良好和表现不好的型号,他们希望建立汽车销售和汽车特性之间的关系。 他们将使用自动化资料准备来准备数据进行分析,同时使用准备“之前”和“之后”的数据构建模型以查看结果的差别。

您的目标是什么? 自动化资料准备可以推荐能够加快其他算法的建模速度、并增强这些模型的预测能力的数据准备步骤。 可包括变换、构建和选择功能。 也可对目标进行变换。 您可以指定数据准备过程应遵循的建模优先级次序。

  • 平衡速度与准确度。 此选项可以准备数据,以使建模算法处理数据的速度和预测的精确度具有同等优先级。
  • 为速度而优化。 此选项可以准备数据,以使建模算法处理数据的速度具有较高优先级。 当您处理超大数据集,或要求快速得到结果时,请选中此选项。
  • 为准确度而优化。 此选项可以准备数据,以使建模算法生成的预测结果的准确性具有较高优先级。
  • 定制分析。 如果您希望手动修改“设置”选项卡上的算法,请选择此选项。 注意,如果您随后在“设置”选项卡上更改了与其他目标之一不一致的选项,则会自动选择该设置。

训练节点

ADP 节点以过程节点实现,其工作方式与类型节点相似。训练 ADP 节点相当于类型节点实例化。 执行分析后,只要上游数据模型不发生更改,就会将指定的变换应用于数据,而无需进一步分析。 与类型和过滤节点类似,在 ADP 节点断开连接后,它会记住数据模型和转换,这样当它重新连接时,就不需要再次训练。这允许您在典型数据子集上训练该节点,然后进行复制或部署,以便在实时数据上多次使用。

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more