자동 군집 노드는 특성이 유사한 레코드 그룹을 식별하는 군집 모델을 추정하고 비교합니다. 노드는 다른 자동화된 모델링 노드와 동일한 방식으로 작동하며 단일 모델링 전달에서 여러 옵션 조합으로 실험할 수 있게 합니다. 군집 모델의 유용성을 필터링하고 순위화하며 특정 필드의 중요성을 기반으로 측도를 제공하려고 시도하는 기본 측도를 사용하여 모델을 비교할 수 있습니다.
군집 모델은 종종 후속 분석의 입력으로 사용할 수 있는 그룹을 식별하는 데 사용됩니다. 예를 들어, 소득과 같은 인구 통계적 특성이나 과거에 구매한 서비스를 기준으로 하여 고객 그룹을 목표화할 수 있습니다. 이 작업은 그룹 및 특성에 대한 사전 지식 없이도(검색할 그룹 수나 그룹을 정의하는 데 사용할 기능을 몰라도 됨) 수행할 수 있습니다. 군집 모델은 대상 필드를 사용하지 않고 참 또는 거짓으로 평가할 수 있는 특정 예측을 리턴하지 않기 때문에 종종 자율 학습 모델이라 부릅니다. 군집 모델의 값은 데이터에서 관심 있는 집단을 캡처하고 이 집단에 대한 유용한 설명을 제공하는 기능으로 판별됩니다.
요구사항. 관심 있는 특성을 정의하는 하나 이상의 필드입니다. 군집 모델은 참 또는 거짓으로 평가할 수 있는 특정 예측을 수행하지 않기 때문에 다른 모델과 동일한 방식으로 대상 필드를 사용하지 않습니다. 대신에 관련될 수 있는 케이스 그룹을 식별하는 데 사용됩니다. 예를 들어, 주어진 컴퓨터가 오퍼에 이탈 또는 응답할지 여부를 예측하는 데는 클러스터 모델을 사용할 수 없습니다. 하지만 고객의 경향을 기준으로 하여 그룹에 고객을 지정하기 위해 군집 모델을 사용할 수는 있습니다. 가중치 및 빈도 필드는 사용하지 않습니다.
평가 필드. 목표가 사용되지 않을 때 선택적으로 모델 비교에 사용할 하나 이상의 평가 필드를 지정할 수 있습니다. 군집 모델의 유용성은 군집이 이러한 필드를 구별하는 정도를 측정하여 평가할 수 있습니다.
지원되는 모델 유형
지원되는 모델 유형에는 이단계, K-평균, 코호넨, One-Class SVM 및 K-평균-AS가 있습니다.