Go back to the English version of the documentationK-Means 节点
K-Means 节点 (SPSS Modeler)
Last updated: 2024年11月22日
K-Means 节点提供一种进行聚类分析的方法。 它可以在您最初不知道存在哪些组时,将数据集聚类为不同的组。 与 SPSS Modeler中的大多数学习方法不同, K-Means 模型 不 使用目标字段。 这种没有目标字段的学习称为无监督学习。 K-Means 模型试图揭示输入字段集的模式,而不是预测结果。 对记录进行分组,以使一个组或聚类中的记录彼此相似,而不同组中的记录则互不相同。
K-Means 的工作原理是根据数据定义一组起始聚类中心。 然后根据记录的输入字段值,将每条记录分配到与其最相似的聚类中。 在分配完所有记录后,更新聚类中心以反映分配到每个聚类的新记录集。 然后再次检查记录,以确定是否应将这些记录重新分配到不同的聚类中,这个记录分配/聚类迭代过程将一直持续,直到达到最大迭代次数或一次迭代与下次迭代之间的改变不超过指定阈值为止。
注: 生成的模型在一定程度上取决于训练数据的顺序。 重排数据顺序并重建模型有可能会生成不同的最终聚类模型。
需求。 要训练 K-Means 模型,您需要一个或多个角色设置为 Input
的字段。 将忽略角色设置为 Output
, Both
或 None
的字段。
强度。 您不需要关于组成员资格的数据即可构建 K 均值模型。 通常,K 均值模型是进行大型数据集聚类的最快方法。