영어 버전 문서로 돌아가기hdbscannode 특성
hdbscannode 특성
마지막 업데이트 날짜: 2024년 10월 07일
Hierarchical Density-Based Spatial Clustering(HDBSCAN)©은 자율 학습을 사용하여 데이터 세트의 군집 또는 밀집된 영역을 찾습니다. SPSS Modeler의 HDBSCAN 노드는 HDBSCAN 라이브러리의 핵심 기능과 일반적으로 사용되는 매개변수를 노출합니다. 이 노드는 Python으로 구현되며, 초기에 그룹이 어떤 그룹인지 모를 때 이 노드를 사용하여 데이터 세트를 구별되는 그룹으로 군집화할 수 있습니다.
hdbscannode 특성 |
데이터 유형 | 특성 설명 |
---|---|---|
custom_fields | 부울 | 이 옵션에서는 업스트림 유형 노드에 지정된 항목 대신, 여기에 지정된 필드 정보를 사용하도록 노드에 지시합니다. 이 옵션을 선택한 후 필요에 따라 다음 필드를 지정하십시오. |
inputs |
필드 | 군집화에 대한 입력 필드입니다. |
useHPO |
부울 | Rbfopt를 기반으로 하는 HPO (Hyper-Parameter Optimization) 를 사용 또는 사용 안함으로 설정하려면 true 또는 false 를 지정하십시오. 그러면 모델이 샘플에서 예상되거나 더 적은 오차 비율을 달성할 수 있도록 최적의 모수 조합을 자동으로 검색합니다. 기본값은 false 입니다. |
min_cluster_size |
정수 | 군집의 최소 크기입니다. 정수를 지정하십시오. 기본값은 5 입니다. |
min_samples |
정수 | 포인트를 코어 포인트 수로 간주하기 위한 이웃 내의 최소 표본
수입니다. 정수를 지정하십시오. 0 (으)로 설정하면 min_cluster_size 이(가) 사용됩니다. 기본값은 0 입니다. |
algorithm |
문자열 | 사용할 알고리즘(best , generic , prims_kdtree , prims_balltree , boruvka_kdtree 또는 boruvka_balltree )을 지정하십시오. 기본값은 best 입니다. |
metric |
문자열 | 기능 배열의 인스턴스 간 거리를 계산할 때 사용할 메트릭 지정: euclidean , cityblock , L1 , L2 , manhattan , braycurtis , canberra , chebyshev , correlation , minkowski 또는 sqeuclidean . 기본값은 euclidean 입니다. |
useStringLabel |
부울 | 문자열 클러스터 레이블을 사용하려면 true 을(를) 지정하고, 숫자 클러스터 레이블을 사용하려면 false 을(를) 지정하십시오. 기본값은 false 입니다. |
stringLabelPrefix |
문자열 | useStringLabel 매개변수가 true (으)로 설정된 경우 문자열 레이블 접두부의 값을 지정하십시오. 기본 접두부는 cluster 입니다. |
approx_min_span_tree |
부울 | 대략적인 최소 스패닝 트리를 허용하려면 true 을(를) 지정하고, 정확성을 위해 속도를 기꺼이 희생하려는 경우 false 을(를) 지정하십시오. 기본값은 true 입니다. |
cluster_selection_method |
문자열 | 요약된 트리에서 클러스터를 선택하는 데 사용할 메소드를 지정하십시오(eom 또는 leaf ). 기본값은 eom (대량 알고리즘 초과)입니다. |
allow_single_cluster |
부울 | 단일 클러스터 결과를 허용하려면 true 을(를) 지정하십시오. 기본값은 false 입니다. |
p_value |
이중 실선 | 메트릭에 minkowski 을(를) 사용하는 경우 사용할 p value 을(를) 지정하십시오. 기본값은 1.5 입니다. |
leaf_size |
정수 | 스페이스 트리 알고리즘(boruvka_kdtree 또는 boruvka_balltree )을 사용하는 경우, 트리의 리프 노드에 있는 점 수를 지정하십시오. 기본값은 40 입니다. |
outputValidity |
부울 | true 또는 false 을(를) 지정하여 유효성 인덱스 차트가 모델 출력에 포함되는지 여부를 제어하십시오. |
outputCondensed |
부울 | true 또는 false 을(를) 지정하여 Condensed 트리 차트가 모델 출력에 포함되는지 여부를 제어하십시오. |
outputSingleLinkage |
부울 | 단일 연결 트리 차트가 모델 출력에 포함되는지 여부를 제어하려면 true 또는 false 을(를) 지정하십시오. |
outputMinSpan |
부울 | 최소 범위 트리 차트가 모델 출력에 포함되는지 여부를 제어하려면 true 또는 false 을(를) 지정하십시오. |
is_split |