Translation not up to date
Hierarchical Hustota-Based Spatial Clustering (HDBSCAN) © používá nedozorované učení k nalezení klastrů nebo hustých oblastí datové sady.
Uzel HDBSCAN v produktu Watson Studio odkrývá základní funkce a běžně používané parametry knihovny HDBSCAN. Uzel je implementován v Pythona vy jej můžete použít k seskupení vašich datových sad do různých skupin, když nevíte, jaké skupiny jsou na začátku. Na rozdíl od nejvýunějších metod v produktu Watson Studiomodely HDBSCAN nepoužívají cílové pole. Tento typ učení, bez cílového pole, se nazývá učení bez dozoru. Místo snahy o předpověď výsledku se HDBSCAN snaží odhalit vzory v sadě vstupních polí. Záznamy jsou seskupeny tak, aby záznamy ve skupině nebo klastru měly tendenci být podobné sobě, ale záznamy v různých skupinách jsou nepodobné. Algoritmus HDBSCAN zobrazuje klastry jako oblasti s vysokou hustotou, které jsou odděleny oblastmi nízké hustoty. Vzhledem k tomuto poněkud generický pohled, klastry nalezené HDBSCAN může být libovolný tvar, na rozdíl od k k k-průměry, které předpokládají, že klastry jsou konvexní tvaru. Výstupnější body, které leží samostatně v regionech s nízkou hustotou, jsou také označeny. HDBSCAN také podporuje hodnocení nových vzorků.1
Chcete-li použít uzel HDBSCAN, musíte nastavit uzel typu předchůdnost. Uzel HDBSCAN bude číst vstupní hodnoty z uzlu Typ (nebo z typů uzlu importu na předchozí úrovni).
Další informace o klastrovaných algoritmech HDBSCAN naleznete v dokumentaci HDBSCAN. 1
1 "Uživatelská příručka/výukový program." Knihovna klastrů pro příkaz hdbscan Clustering. Web. © 2016, Leland McInnes, John Healy, Steve Astels.