Go back to the English version of the documentationKNN 节点
KNN 节点 (SPSS Modeler)
Last updated: 2024年11月22日
“最近邻元素分析”是根据观测值与其他观测值的类似程度分类观测值的方法。 在机器学习中,将其开发为识别数据模式的一种方法,而不需要与任何存储模式或观测值完全匹配。 类似观测值相互靠近,而不同观测值相互远离。 因此,两个观测值之间的距离是其不相似性的测量。
将靠近彼此的观测值视为“相邻元素”。 当提出新的观测值(holdout 观测值)时,计算其到模型中每个观测值的距离。 计算最相似观测值(最近邻元素)的分类,并将新观测值放在包含最多最近邻元素的类别中。
您可以指定要检查的最近邻元素数目,该值称为 k
。 这些图显示了如何使用两个不同的 k
值对新案例进行分类。 当 k
= 5 时,新案例将放在类别 1
中,因为大多数最近邻元素都属于类别 1
。 但当 k
= 9 时,新观测值将放在类别 0
中,因为大多数最近邻元素都属于类别 0
。
最近邻元素分析也可用于计算连续目标的值。 在此情况下,最近邻元素的平均值或中间目标值用于获得新观测值的预测值。