HDBSCAN© (Hierarchical Density-Based Spatial Clustering) verwendet nicht überwachtes Lernen zum Suchen von Clustern (oder dicht besetzten Bereichen) eines Datasets.
Der HDBSCAN-Knoten in watsonx.ai stellt die zentralen Funktionen und häufig verwendeten Parameter der HDBSCAN-Bibliothek bereit. Der Knoten wird in Python implementiert und Sie können ihn verwenden, um Ihr Dataset in verschiedene Gruppen aufzuteilen, wenn Sie anfangs noch nicht wissen, was diese Gruppen enthalten. Im Gegensatz zu den meisten Lernmethoden in watsonx.aiverwenden HDBSCAN-Modelle kein Zielfeld. Diese Art des Lernens, d. h. ohne Zielfeld, wird als nicht überwachtes Lernen bezeichnet. Statt zu versuchen, ein Ergebnis vorherzusagen, versuchen HDBSCAN-Knoten, Muster im Set der Eingabefelder zu entdecken. Datensätze werden in Gruppen zusammengefasst, wobei Datensätze innerhalb einer Gruppe oder eines Clusters ähnlich und Datensätze in verschiedenen Gruppen unterschiedlich sind. Der HDBSCAN-Algorithmus betrachtet Cluster als Bereiche hoher Speicherdichte, die von Bereichen mit geringer Dichte getrennt sind. Aufgrund dieser eher generischen Ansicht können Cluster, die von HDBSCAN gefunden werden, eine beliebige Form haben, im Gegensatz zu K-Means, das davon ausgeht, dass die Cluster konvex geformt sind. Ausreißerpunkte, die allein in Regionen mit geringer Dichte liegen, werden ebenfalls markiert. HDBSCAN unterstützt auch das Scoring von neuen Stichproben.1
Wenn Sie den HDBSCAN-Knoten verwenden möchten, müssen Sie einen vorgeordneten Typknoten einrichten. Der HDBSCAN-Knoten liest die Eingabewerte vom Typknoten (oder von den Typen eines vorgeordneten Importknotens).
Weitere Informationen zu HDBSCAN-Clusteralgorithmen finden Sie in der HDBSCAN-Dokumentation. 1
1 "Benutzerhandbuch/Lernprogramm". Die Clusterbibliothek 'hdbscan'. Web. © 2016, Leland McInnes, John Healy, Steve Astels.