0 / 0
Go back to the English version of the documentation
“汇总”节点
Last updated: 2024年10月07日
聚集节点 (SPSS Modeler)

汇总是一项数据准备任务,经常用于缩减数据集的大小。 在执行汇总之前,您应该花一些时间来清理数据,尤其要关注缺失值。 可能会丢失有关缺失值的可能有用的聚集信息。

您可以使用“汇总”节点将一系列输入记录替换为摘要,即经过汇总的输出记录。 例如,您可能有一组下表所示的输入销售记录。

表 1. 销售记录输入示例
年龄 性别 区域 分支 Sales
23 M S 8 4
45 M S 16 4
37 M S 8 5
30 M S 5 7
44 M N 4 9
25 M N 2 11
29 F S 16 6
41 F N 4 8
23 F N 6 2
45 F N 4 5
33 F N 6 10

可以将 SexRegion 作为键字段,对这些记录进行汇总。 然后选择以方式 Mean 聚集 Age ,以方式 Sum聚集 Sales 。 选中将记录计数包括在字段中汇总节点选项,汇总输出类似于下表。

表 2. 汇总记录示例
Age(均值) 性别 区域 Sales(总和) 记录计数
35.5 F N 25 4
29 F S 6 1
34.5 M N 20 2
33.75 M S 20 4

例如,您可从中了解到,北部 (North) 地区四名女性销售人员的平均年龄为 35.5 岁,其销售总量为 25 件产品。

注: 未指定聚集方式时,将自动废弃诸如 Branch 之类的字段。
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more