kmeansasnode 특성
마지막 업데이트 날짜: 2025년 2월 11일
K-평균은 일반적으로 가장 많이 사용되는 군집 알고리즘 중 하나입니다. 여기에서는 데이터 포인트를 사전 정의된 군집 수로 모읍니다. SPSS Modeler의 K-Means-AS 노드는 스파크에서 구현됩니다. k-평균 알고리즘에 대한 자세한 내용은 클러스터링.1를 참조하세요
주: K-Means-AS 노드는 범주형 변수에 대해 자동으로 원핫 인코딩을 수행합니다.
특성 |
값 | 특성 설명 |
---|---|---|
|
문자열 | 사전 정의된 역할을 사용하려면 을(를) 지정하고, 사용자 정의 필드 지정을 사용하려면 을(를) 지정하십시오. 기본값은 입니다. |
|
부울 | 생성된 새 스코어링 필드에 대해 기본 이름( )을 사용하려면 을(를) 지정하고, 사용자 정의 이름을 사용하려면 을(를) 지정하십시오. 기본값은 입니다. |
|
필드 | 특성이 (으)로 설정된 경우 입력에 대한 필드 이름 목록입니다. |
|
문자열 | 특성이 (으)로 설정된 경우 생성된 새 스코어링 필드의 이름입니다. |
|
정수 | 작성할 군집 수입니다. 기본값은 입니다. |
|
문자열 | 초기화 알고리즘입니다. 가능한 값은 또는 입니다. 기본값은 입니다. |
|
정수 | 이(가) (으)로 설정된 경우 초기화 단계 수. 기본값은 입니다. |
|
부울 | 을(를) 지정하여 다음 네 개의 특성을 사용 가능하게 하십시오. 기본값은 입니다. |
|
정수 | 군집에 대한 최대 반복 수입니다. 기본값은 입니다. |
|
문자열 | 반복을 중단하는 공차입니다. 가능한 설정은 , , ..., 입니다. 기본값은 입니다. |
|
부울 | 사용자 정의 무작위 시드를 사용하려면 을(를) 지정하십시오. 기본값은 입니다. |
|
정수 | 특성이 인 경우 사용자 정의 무작위 seed입니다. |
|
부울 | 출력에 그래프를 포함시키려는 경우 이 옵션을 선택하십시오. |
1 "클러스터링 - RDD 기반 API." Apache Spark. MLlib: Main Guide. 2024년 8월
주제가 도움이 되었습니까?
0/1000