資料の 英語版 に戻るKNN ノード
KNN ノード (SPSS Modeler)
最終更新: 2024年11月22日
最近傍分析は、そのほかのケースに対する類似性に基づいてケースを分類する方法です。 マシン学習で、保存されたパターン、またはケースに完全に一致する必要なくデータのパターンを認識する方法として開発されました。 類似したケースはお互いに近く、類似していないケースはお互いに離れています。 つまり、2 つのケース間の距離は、それらの非類似度の尺度です。
お互いに近いケースは、「近傍」と呼ばれます。 新しいケース (ホールドアウト) が表示されたときに、モデル内の各ケースからの距離が計算されます。 最も類似した分類 - 最近傍 - が集計され、新しいケースが、最大数の最近傍を含むカテゴリーに振り分けられます。
調査する最近隣の数を指定でき、この値は k
と呼ばれます。 写真は、k
の 2 つの異なる値を使用して新しいケースがどのように分類されるかを示しています。 k
= 5 の場合、最近傍の大部分がカテゴリー 1
に属するため、新しいケースはカテゴリー 1
にあります。 ただし、 k
= 9 の場合、最近傍の大部分がカテゴリー 0
に属しているため、新しいケースはカテゴリー 0
に配置されます。
また、最近傍分析を使用して、連続型対象の値を計算することもできます。 この場合、最近傍の平均対象値または中央対象値を使用して、新しいケースの予測値が取得されます。