Translation not up to date
Hierarchiczne grupowanie przestrzenne na podstawie gęstości (Hierarchical Density-Based Spatial Clustering, HDBSCAN)© to technika znajdowania skupień lub gęstych obszarów zbioru danych przy wykorzystaniu uczenie nienadzorowanego.
Węzeł HDBSCAN w programie Watson Studio ujawnia podstawowe funkcje i powszechnie używane parametry biblioteki HDBSCAN. Węzeł jest zaimplementowany w języku Python i można go użyć do skupiania zbioru danych w osobne grupy, jeśli nie wiemy z góry, co to są za grupy. W przeciwieństwie do większości metod uczenia się w programie Watson Studio, modele HDBSCAN nie korzystają z pola docelowego. Sposób uczenia bez zmiennej przewidywanej jest nazywany uczeniem nienadzorowanym. Węzeł HDBSCAN nie próbuje przewidzieć wyniku, lecz ujawnia istniejące wzorce w zbiorze zmiennych wejściowych. Rekordy są grupowane w taki sposób, aby rekordy w ramach grupy lub skupienia były do siebie podobne, zaś rekordy z różnych grup były do siebie niepodobne. Algorytm HDBSCAN wyświetla klastry jako obszary o wysokiej gęstości oddzielone obszarami o niskiej gęstości. Ze względu na ten, raczej ogólny widok, klastry znalezione przez HDBSCAN mogą mieć dowolny kształt, w przeciwieństwie do k-oznacza, który zakłada, że klastry są wypukłe kształtowane. Punkty wartości odstających, które leżą w regionach o niskiej gęstości, są również oznaczone. Węzeł HDBSCAN obsługuje również ocenianie nowych próbek.1
Aby użyć węzła HDBSCAN, należy skonfigurować poprzedzający węzeł Typ. Węzeł HDBSCAN odczyta wartości wejściowe z węzła Typ (lub z typów węzła importu wyższego poziomu).
Więcej informacji na temat algorytmów grupowania HDBSCAN zawiera dokumentacja HDBSCAN. 1
1 „Podręcznik użytkownika / Samouczek.” Biblioteka skupień hdbscan. WWW. © 2016, Leland McInnes, John Healy, Steve Astels.