kmeansasnode 특성

마지막 업데이트 날짜: 2025년 2월 11일

kmeansasnode 특성

K-평균-AS 노드 아이콘 K-평균은 일반적으로 가장 많이 사용되는 군집 알고리즘 중 하나입니다. 여기에서는 데이터 포인트를 사전 정의된 군집 수로 모읍니다. SPSS Modeler의 K-Means-AS 노드는 스파크에서 구현됩니다. k-평균 알고리즘에 대한 자세한 내용은 클러스터링.¹를 참조하세요

주: K-Means-AS 노드는 범주형 변수에 대해 자동으로 원핫 인코딩을 수행합니다.

표 1. kmeansasnode 특성
`kmeansasnode` 특성	값	특성 설명
`roleUse`	문자열	사전 정의된 역할을 사용하려면 `predefined`을(를) 지정하고, 사용자 정의 필드 지정을 사용하려면 `custom`을(를) 지정하십시오. 기본값은 `predefined`입니다.
`autoModel`	부울	생성된 새 스코어링 필드에 대해 기본 이름(`$S-prediction`)을 사용하려면 `true`을(를) 지정하고, 사용자 정의 이름을 사용하려면 `false`을(를) 지정하십시오. 기본값은 `true`입니다.
`features`	필드	`roleUse` 특성이 `custom`(으)로 설정된 경우 입력에 대한 필드 이름 목록입니다.
`name`	문자열	`autoModel` 특성이 `false`(으)로 설정된 경우 생성된 새 스코어링 필드의 이름입니다.
`clustersNum`	정수	작성할 군집 수입니다. 기본값은 `5`입니다.
`initMode`	문자열	초기화 알고리즘입니다. 가능한 값은 `k-means\|\|` 또는 `random`입니다. 기본값은 `k-means\|\|`입니다.
`initSteps`	정수	`initMode`이(가) `k-means\|\|`(으)로 설정된 경우 초기화 단계 수. 기본값은 `2`입니다.
`advancedSettings`	부울	`true`을(를) 지정하여 다음 네 개의 특성을 사용 가능하게 하십시오. 기본값은 `false`입니다.
`maxIteration`	정수	군집에 대한 최대 반복 수입니다. 기본값은 `20`입니다.
`tolerance`	문자열	반복을 중단하는 공차입니다. 가능한 설정은 `1.0E-1`, `1.0E-2`, ..., `1.0E-6`입니다. 기본값은 `1.0E-4`입니다.
`setSeed`	부울	사용자 정의 무작위 시드를 사용하려면 `true`을(를) 지정하십시오. 기본값은 `false`입니다.
`randomSeed`	정수	`setSeed` 특성이 `true`인 경우 사용자 정의 무작위 seed입니다.
`displayGraph`	부울	출력에 그래프를 포함시키려는 경우 이 옵션을 선택하십시오.