Go back to the English version of the documentation二阶-AS 聚类节点
TwoStep-AS集群节点SPSS Modeler
Last updated: 2024年11月22日
“二阶聚类”是一个探索工具,用于揭示数据集中原本不明显的自然分组(即聚类)。 此过程使用的算法有多个不错的特征使其有别于传统聚类方法。
- 分类变量和连续变量的处理。 通过假设变量是独立的,可以假设分类变量和连续变量服从联合多项正态分布。
- 自动选择聚类的数量。 通过跨不同的聚类解比较模型选择准则的值,此过程可以自动确定最优的聚类数。
- 可伸缩性。 通过构造对记录进行摘要的聚类特征 (CF) 树,二阶算法能够分析大型数据文件。
例如,零售和消费者产品公司定期地对描述客户的购买习惯、性别、年龄、收入水平和其他属性的信息应用聚类技术。 这些公司针对每个消费者群体定制其市场营销和产品开发战略,以提高销售量并建立品牌忠诚度。