0 / 0
Go back to the English version of the documentation
笔记本中的 SPSS 预测性分析集群算法
Last updated: 2024年10月07日
笔记本中的 SPSS 预测性分析集群算法

您可以使用可扩展的二步法或集群模型评估算法对 Notebook 中的数据进行集群。

两步聚类

可扩展的两步聚类算法基于我们所熟悉的两步聚类算法,但从多个方面扩展了其功能和性能。

首先,此算法可以有效处理 Spark(提供 Map-Reduce 计算范式)支持的大量分布式数据。

其次此算法提供了多种机制,用于选择最相关特征以对给定数据进行聚类以及检测罕见的离群点。 此外,它还为支持洞察提供了一组增强的评估和诊断功能。

两步聚类算法首先执行预聚类步骤,方法是扫描整个数据集,并根据摘要统计信息(称为聚类特征)来存储密集区域的数据用例。 聚类特征以“CF 树”数据结构存储在内存中。 最后,应用凝聚式分层聚类算法对聚类特征集进行聚类。

Python 示例代码:

from spss.ml.clustering.twostep import TwoStep

cluster = TwoStep(). \
    setInputFieldList(["region", "happy", "age"]). \
    setDistMeasure("LOGLIKELIHOOD"). \
    setFeatureImportanceMethod("CRITERION"). \
    setAutoClustering(True)

clusterModel = cluster.fit(data)
predictions = clusterModel.transform(data)
predictions.show()

聚类模型评估

聚类模型评估 (CME) 旨在解释聚类模型,并根据各种评估度量方式来发现有用的洞察。

这是一种通用且独立于任何类型的聚类模型的建模后分析。

Python 示例代码:

from spss.ml.clustering.twostep import TwoStep

cluster = TwoStep(). \
    setInputFieldList(["region", "happy", "age"]). \
    setDistMeasure("LOGLIKELIHOOD"). \
    setFeatureImportanceMethod("CRITERION"). \
    setAutoClustering(True)

clusterModel = cluster.fit(data)
predictions = clusterModel.transform(data)
predictions.show()

父主题: SPSS 预测分析算法

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more