이단계 군집 노드는 군집분석 양식을 제공합니다. 초기에 그룹이 어떤 그룹인지 모를 때 데이터 세트를 구별되는 그룹으로 군집화하는 데 사용할 수 있습니다. 코호넨 노드 및 K-평균 노드의 경우 이단계 군집 모델이 대상 필드를 사용하지 않습니다. 이단계 군집은 결과를 예측하려 시도하지 않고 입력 필드 세트의 패턴을 밝히려 시도합니다. 레코드가 그룹화되므로 그룹 또는 군집 내 레코드는 서로 유사한 경향이 있지만, 다른 그룹의 레코드는 비슷하지 않습니다.
이단계 군집은 이단계 군집방법입니다. 첫 번째 단계는 데이터를 한 번 전달하며 이 과정에서 원시 입력 데이터가 관리 가능한 부군집 세트로 압축됩니다. 두 번째 단계는 계층적 군집방법을 사용하여 데이터를 또 한번 전달할 필요 없이 부군집을 점점 더 큰 군집으로 병합합니다. 계층적 군집은 미리 군집 수를 선택하지 않아도 되는 장점이 있습니다. 많은 계층적 군집 방법은 개별 레코드로 시작해서 군집을 시작하고 더 큰 군집을 생성하기 위해 반복적으로 군집을 병합합니다. 이러한 접근법은 종종 많은 양의 데이터로 실패하지만 이단계의 초기 사전 군집화는 심지어 큰 데이터 세트의 경우에도 계층적 군집을 빠르게 작성합니다.
요구사항. TwoStep 군집 모델을 훈련시키려면 역할이 Input
로 설정된 하나 이상의 필드가 필요합니다. 역할이 Target
, Both
또는 None
로 설정된 필드는 무시됩니다. 이단계 군집 알고리즘은 결측값을 핸들하지 않습니다. 모델을 작성할 때 입력 필드가 공백인 레코드는 무시됩니다.
강도. 이단계 군집은 혼합 필드 유형을 핸들할 수 있으며 큰 데이터 세트를 효율적으로 핸들할 수 있습니다. 여러 군집 솔루션을 검정하여 최상의 솔루션을 선택하는 기능이 있으므로 처음에 요청할 군집 수를 알고 있지 않아도 됩니다. 이상치 또는 결과를 오염시킬 수 있는 매우 비정상적인 케이스를 자동으로 제외하도록 이단계 군집을 설정할 수 있습니다.