Go back to the English version of the documentation“汇总”节点
聚集节点 (SPSS Modeler)
Last updated: 2024年10月07日
汇总是一项数据准备任务,经常用于缩减数据集的大小。 在执行汇总之前,您应该花一些时间来清理数据,尤其要关注缺失值。 可能会丢失有关缺失值的可能有用的聚集信息。
您可以使用“汇总”节点将一系列输入记录替换为摘要,即经过汇总的输出记录。 例如,您可能有一组下表所示的输入销售记录。
年龄 | 性别 | 区域 | 分支 | Sales |
---|---|---|---|---|
23 | M | S | 8 | 4 |
45 | M | S | 16 | 4 |
37 | M | S | 8 | 5 |
30 | M | S | 5 | 7 |
44 | M | N | 4 | 9 |
25 | M | N | 2 | 11 |
29 | F | S | 16 | 6 |
41 | F | N | 4 | 8 |
23 | F | N | 6 | 2 |
45 | F | N | 4 | 5 |
33 | F | N | 6 | 10 |
可以将 Sex
和 Region
作为键字段,对这些记录进行汇总。 然后选择以方式 Mean 聚集 Age
,以方式 Sum聚集 Sales
。 选中将记录计数包括在字段中汇总节点选项,汇总输出类似于下表。
Age(均值) | 性别 | 区域 | Sales(总和) | 记录计数 |
---|---|---|---|---|
35.5 | F | N | 25 | 4 |
29 | F | S | 6 | 1 |
34.5 | M | N | 20 | 2 |
33.75 | M | S | 20 | 4 |
例如,您可从中了解到,北部 (North) 地区四名女性销售人员的平均年龄为 35.5 岁,其销售总量为 25 件产品。
注: 未指定聚集方式时,将自动废弃诸如
Branch
之类的字段。