0 / 0
영어 버전 문서로 돌아가기
kmeansasnode 특성
마지막 업데이트 날짜: 2024년 9월 10일
kmeansasnode 특성

K-평균-AS 노드 아이콘K-평균은 일반적으로 가장 많이 사용되는 군집 알고리즘 중 하나입니다. 여기에서는 데이터 포인트를 사전 정의된 군집 수로 모읍니다. SPSS Modeler의 K-Means-AS 노드는 스파크에서 구현됩니다. k-평균 알고리즘에 대한 자세한 내용은 클러스터링.1를 참조하세요

주: K-Means-AS 노드는 범주형 변수에 대해 자동으로 원핫 인코딩을 수행합니다.
표 1. kmeansasnode 특성
kmeansasnode 특성 특성 설명
roleUse 문자열 사전 정의된 역할을 사용하려면 predefined을(를) 지정하고, 사용자 정의 필드 지정을 사용하려면 custom을(를) 지정하십시오. 기본값은 predefined입니다.
autoModel 부울 생성된 새 스코어링 필드에 대해 기본 이름($S-prediction)을 사용하려면 true을(를) 지정하고, 사용자 정의 이름을 사용하려면 false을(를) 지정하십시오. 기본값은 true입니다.
features 필드 roleUse 특성이 custom(으)로 설정된 경우 입력에 대한 필드 이름 목록입니다.
name 문자열 autoModel 특성이 false(으)로 설정된 경우 생성된 새 스코어링 필드의 이름입니다.
clustersNum 정수 작성할 군집 수입니다. 기본값은 5입니다.
initMode 문자열 초기화 알고리즘입니다. 가능한 값은 k-means|| 또는 random입니다. 기본값은 k-means||입니다.
initSteps 정수 initMode이(가) k-means||(으)로 설정된 경우 초기화 단계 수. 기본값은 2입니다.
advancedSettings 부울 true을(를) 지정하여 다음 네 개의 특성을 사용 가능하게 하십시오. 기본값은 false입니다.
maxIteration 정수 군집에 대한 최대 반복 수입니다. 기본값은 20입니다.
tolerance 문자열 반복을 중단하는 공차입니다. 가능한 설정은 1.0E-1, 1.0E-2, ..., 1.0E-6입니다. 기본값은 1.0E-4입니다.
setSeed 부울 사용자 정의 무작위 시드를 사용하려면 true을(를) 지정하십시오. 기본값은 false입니다.
randomSeed 정수 setSeed 특성이 true인 경우 사용자 정의 무작위 seed입니다.
displayGraph 부울 출력에 그래프를 포함시키려는 경우 이 옵션을 선택하십시오.

1 "클러스터링 - RDD 기반 API." Apache Spark. MLlib: Main Guide. 2024년 8월

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기