K-평균 노드는 군집분석 방법을 제공합니다. 초기에 그룹이 어떤 그룹인지 모를 때 데이터 세트를 구별되는 그룹으로 군집화하는 데 사용할 수 있습니다. SPSS Modeler의 대부분의 학습 방법과 달리 K-평균 모델은 대상 필드를 사용하지 않습니다 . 대상 필드가 없는 이 학습 유형은 자율 학습이라고 합니다. 결과를 예측하는 대신, K-평균은 입력 필드 세트에서 패턴을 파악하려고 합니다. 레코드가 그룹화되므로 그룹 또는 군집 내 레코드는 서로 유사한 경향이 있지만, 다른 그룹의 레코드는 비슷하지 않습니다.
K-평균은 데이터에서 파생된 시작 군집 중심의 세트를 정의하여 작동합니다. 그런 다음, 레코드의 입력 필드 값에 기반하여 가장 유사한 군집에 각 레코드를 지정합니다. 모든 케이스가 지정된 후에 군집 중심은 각 군집에 지정된 새 레코드 세트를 반영하도록 업데이트됩니다. 그러면 다른 군집에 재지정해야 하는지 여부를 확인하기 위해 레코드를 다시 확인하고, 최대 반복 수에 도달할 때까지 레코드 지정/군집 반복 프로세스를 계속합니다. 그렇지 않으면 한 반복과 다음 실패 사이의 변경이 지정된 임계값을 초과하지 않습니다.
요구사항. K-평균 모델을 훈련하려면 역할이 Input
로 설정된 하나 이상의 필드가 필요합니다. 역할이 Output
, Both
또는 None
로 설정된 필드는 무시됩니다.
강도. K-평균 모델을 작성하기 위해 소속그룹에 데이터는 없어도 됩니다. K-평균 모델은 대형 데이터 세트 군집을 위한 가장 빠른 방법이기도 합니다.