K-Means ノードは、クラスター分析手法を提供しています。 開始時にグループの性質がわからない場合に、このノードを使用してデータセットを異なるグループにクラスター化できます。 SPSS Modelerのほとんどの学習方法とは異なり、K-Means モデルは対象フィールドを使用 しません 。 このタイプの学習は、対象フィールドがないことから、教師なし学習と呼ばれます。 K-Means では、結果が予測されるのではなく、一連の入力フィールドのパターンが明らかにされます。 レコードは、1 つのグループまたはクラスター内のレコード同士がよく似た特性を持ち、異なるグループのレコードが互いに類似しないように分類されます。
K-Means では、データから派生した開始クラスター中心のセットが定義されます。 その後、レコードの入力フィールド値を基に、各レコードが最も類似するクラスターに割り当てられます。 ケースの割り当てが完了すると、クラスター中心が更新され、各クラスターに割り当てられた新しいレコードのセットが反映されます。 その後、レコードを別のクラスターに再割り当てする必要があるかどうかが再確認されます。このレコード割り当てとクラスター反復の過程は、最大反復数に達するまで、またはある反復処理と次の反復処理間の変化が、指定された閾値を超えなくなるまで繰り返されます。
要件。 K-Means モデルをトレーニングするには、役割が Input
に設定された 1 つ以上のフィールドが必要です。 役割が Output
、 Both
、または None
に設定されているフィールドは無視されます。
利点 所属グループにデータがなくても K-Means モデルを作成することができます。 たいていの場合 K-Means モデルを使用すると、大量のデータセットを最も高速にクラスター化できます。