영어 버전 문서로 돌아가기kmeansasnode 특성
kmeansasnode 특성
마지막 업데이트 날짜: 2024년 9월 10일
K-평균은 일반적으로 가장 많이 사용되는 군집 알고리즘 중 하나입니다. 여기에서는 데이터 포인트를 사전 정의된 군집 수로 모읍니다. SPSS Modeler의 K-Means-AS 노드는 스파크에서 구현됩니다. k-평균 알고리즘에 대한 자세한 내용은 클러스터링.1를 참조하세요
주: K-Means-AS 노드는 범주형 변수에 대해 자동으로 원핫 인코딩을 수행합니다.
kmeansasnode 특성 |
값 | 특성 설명 |
---|---|---|
roleUse |
문자열 | 사전 정의된 역할을 사용하려면 predefined 을(를) 지정하고, 사용자 정의 필드 지정을 사용하려면 custom 을(를) 지정하십시오. 기본값은 predefined 입니다. |
autoModel |
부울 | 생성된 새 스코어링 필드에 대해 기본 이름($S-prediction )을 사용하려면 true 을(를) 지정하고, 사용자 정의 이름을 사용하려면 false 을(를) 지정하십시오. 기본값은 true 입니다. |
features |
필드 | roleUse 특성이 custom (으)로 설정된 경우 입력에 대한 필드 이름 목록입니다. |
name |
문자열 | autoModel 특성이 false (으)로 설정된 경우 생성된 새 스코어링 필드의 이름입니다. |
clustersNum |
정수 | 작성할 군집 수입니다. 기본값은 5 입니다. |
initMode |
문자열 | 초기화 알고리즘입니다. 가능한 값은 k-means|| 또는 random 입니다. 기본값은 k-means|| 입니다. |
initSteps |
정수 | initMode 이(가) k-means|| (으)로 설정된 경우 초기화 단계 수. 기본값은 2 입니다. |
advancedSettings |
부울 | true 을(를) 지정하여 다음 네 개의 특성을 사용 가능하게 하십시오. 기본값은 false 입니다. |
maxIteration |
정수 | 군집에 대한 최대 반복 수입니다. 기본값은 20 입니다. |
tolerance |
문자열 | 반복을 중단하는 공차입니다. 가능한 설정은 1.0E-1 , 1.0E-2 , ..., 1.0E-6 입니다. 기본값은 1.0E-4 입니다. |
setSeed |
부울 | 사용자 정의 무작위 시드를 사용하려면 true 을(를) 지정하십시오. 기본값은 false 입니다. |
randomSeed |
정수 | setSeed 특성이 true 인 경우 사용자 정의 무작위 seed입니다. |
displayGraph |
부울 | 출력에 그래프를 포함시키려는 경우 이 옵션을 선택하십시오. |
1 "클러스터링 - RDD 기반 API." Apache Spark. MLlib: Main Guide. 2024년 8월