Go back to the English version of the documentationHDBSCAN 节点
HDBSCAN 节点 (SPSS Modeler)
Last updated: 2024年11月22日
Hierarchical Density-Based Spatial Clustering (HDBSCAN)© 使用非监督学习来查找数据集的聚类或密集区域。
watsonx.ai Studio中的 HDBSCAN 节点公开了 HDBSCAN 库的核心功能和常用参数。 此节点以 Python 实现,当您一开始不了解数据集的分组时,可以使用此节点将数据集聚类为不同的组。 与 "watsonx.ai Studio中的大多数学习方法不同,HDBSCAN 模型不使用目标字段。 这种没有目标字段的学习称为无监督学习。 HDBSCAN 试图揭示输入字段集的模式,而不是预测结果。 对记录进行分组,以使一个组或聚类中的记录彼此相似,而不同组中的记录则互不相同。 HDBSCAN 算法将聚类视为高密度区域,这些区域之间由低密度区域分隔。 由于这种观点比较笼统,HDBSCAN 所发现的聚类可以是任意形状,这与假设聚类为凸面形的 K 均值算法完全不同。 对于单独位于低密度区域中的离群点,也会予以标记。 HDBSCAN 还支持对新样本进行评分。1
要使用 HDBSCAN 节点,必须设置上游“类型”节点。 HDBSCAN 节点将从“类型”节点(或者上游导入节点的“类型”)读取输入值。
有关 HDBSCAN 集群算法的更多信息,请参阅 HDBSCAN 文档。 1
1 "用户指南/教程"。 hdbscan 集群库。 Web。 © 2016, Leland McInnes, John Healy, Steve Astels.