Hierarchical Density-Based Spatial Clustering(HDBSCAN)©은 자율 학습을 사용하여 데이터 세트의 군집 또는 밀집된 영역을 찾습니다.
watsonx.ai 의 HDBSCAN 노드는 HDBSCAN 라이브러리의 핵심 기능 및 일반적으로 사용되는 매개변수를 표시합니다. 이 노드는 Python으로 구현되며, 초기에 그룹이 어떤 그룹인지 모를 때 이 노드를 사용하여 데이터 세트를 구별되는 그룹으로 군집화할 수 있습니다. watsonx.ai의 대부분의 학습 방법과 달리 HDBSCAN 모델은 대상 필드를 사용하지 않습니다 . 대상 필드가 없는 이 학습 유형은 자율 학습이라고 합니다. HDBSCAN은 결과를 예측하는 대신, 입력 필드 세트에서 패턴을 파악하려고 합니다. 레코드가 그룹화되므로 그룹 또는 군집 내 레코드는 서로 유사한 경향이 있지만, 다른 그룹의 레코드는 비슷하지 않습니다. HDBSCAN 알고리즘은 클러스터를 저밀도 영역으로 구분된 고밀도 영역으로 간주합니다. 이처럼 다소 일반적인 관점 때문에, K-평균에서는 클러스터가 볼록한 형태로 간주되지만, HDBSCAN에서 발견한 클러스터는 어떤 형태로도 가능합니다. 저밀도 영역에 있는 이상치 포인트도 표시됩니다. HDBSCAN은 또한 새로운 표본의 스코어링도 지원합니다.1
HDBSCAN 노드를 사용하려면 업스트림 유형 노드를 설정해야 합니다. HDBSCAN 노드는 유형 노드(또는 업스트림 가져오기 노드의 유형)에서 입력 값을 읽습니다.
HDBSCAN 군집화 알고리즘에 대한 자세한 정보는 HDBSCAN 문서를 참조하십시오. 1
1 "사용자 안내서/자습서". hdbscan 군집 라이브러리. 웹. © 2016, Leland McInnes, John Healy, Steve Astels.