영어 버전 문서로 돌아가기twostepnode 특성
twostepnode 특성
마지막 업데이트 날짜: 2024년 10월 07일
이단계 노드는 2단계 군집방법을 사용합니다. 첫 번째 단계는 원시 입력 데이터를 관리 가능한 하위 군집 세트로 압축하기 위해 데이터를 통한 단일 전달을 수행합니다. 두 번째 단계는 계층적 군집 방법을 사용하여 하위 군집을 점점 더 큰 군집으로 계속해서 병합하는 것입니다. 이단계는 훈련 데이터에 대한 최적 군집 수를 자동으로 평가하는 장점이 있습니다. 혼합 필드 유형과 대형 데이터 세트를 효율적으로 처리할 수 있습니다.
예
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)
twostepnode 특성 |
값 | 특성 설명 |
---|---|---|
inputs |
[field1 ... fieldN] | 이단계 모델은 입력 필드의 목록을 사용하지만 목표는 없습니다. 가중치 및 빈도 필드는 인식되지 않습니다. 자세한 정보는 공통 모델링 노드 특성 을 참조하십시오. |
standardize |
플래그 | |
exclude_outliers |
플래그 | |
percentage |
Number | |
cluster_num_auto |
플래그 | |
min_num_clusters |
Number | |
max_num_clusters |
Number | |
num_clusters |
Number | |
cluster_label |
String Number |
|
label_prefix |
문자열 | |
distance_measure |
Euclidean Loglikelihood |
|
clustering_criterion |
AIC BIC |