Zurück zur englischen Version der DokumentationEigenschaften von "hdbscannode"
Eigenschaften von "hdbscannode"
Letzte Aktualisierung: 07. Okt. 2024
HDBSCAN© (Hierarchical Density-Based Spatial Clustering) verwendet nicht überwachtes Lernen zum Suchen von Clustern (oder dicht besetzten Bereichen) eines Datasets. Der HDBSCAN-Knoten in SPSS Modeler stellt die zentralen Funktionen und häufig verwendeten Parameter der HDBSCAN-Bibliothek bereit. Der Knoten wird in Python implementiert und Sie können ihn verwenden, um Ihr Dataset in verschiedene Gruppen aufzuteilen, wenn Sie anfangs noch nicht wissen, was diese Gruppen enthalten.
hdbscannode Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
custom_fields | Boolesch | Diese Option weist den Knoten an, die hier angegebenen Feldinformationen anstelle der in einem vorgeordneten Typknoten angegebenen zu verwenden. Geben Sie nach Auswahl dieser Option nach Bedarf die folgenden Felder an. |
inputs |
Feld | Eingabefelder für Clustering. |
useHPO |
Boolesch | Geben Sie true oder false an, um die Hyper-Parameter-Optimierung (HPO) auf der Basis von Rbfopt zu aktivieren oder zu inaktivieren, die automatisch die optimale Kombination von Parametern erkennt, sodass das Modell die erwartete oder niedrigere Fehlerrate in den Stichproben erreicht. Der Standardwert ist false . |
min_cluster_size |
Ganze Zahl | Die Mindestgröße von Clustern. Geben Sie eine Ganzzahl an. Der Standardwert ist 5 . |
min_samples |
Ganze Zahl | Die Anzahl der Stichproben in einer Nachbarschaft für einen Punkt, der als zentraler Punkt betrachtet werden soll. Geben Sie eine Ganzzahl an. Wenn der Wert auf 0 gesetzt ist, wird min_cluster_size verwendet. Der Standardwert ist 0 . |
algorithm |
Zeichenfolge | Geben Sie an, welcher Algorithmus verwendet werden soll: best , generic , prims_kdtree , prims_balltree , boruvka_kdtree oderboruvka_balltree . Der Standardwert ist best . |
metric |
Zeichenfolge | Geben Sie an, welche Metrik beim Berechnen der Distanz zwischen Instanzen in einem Feature-Array verwendet werden soll: euclidean , cityblock , L1 , L2 , manhattan , braycurtis , canberra , chebyshev , correlation , minkowski odersqeuclidean . Der Standardwert ist euclidean . |
useStringLabel |
Boolesch | Geben Sie true an, um eine Zeichenfolge als Clusterbezeichnung zu verwenden, oder false , um eine Zahl als Clusterbezeichnung zu verwenden. Der Standardwert ist false . |
stringLabelPrefix |
Zeichenfolge | Wenn der Parameter useStringLabel auf true gesetzt ist, geben Sie einen Wert für das Präfix der Zeichenfolgebezeichnung an. Das Standardpräfix istcluster . |
approx_min_span_tree |
Boolesch | Geben Sie true an, um einen ungefähren minimalen Spanning Tree zu akzeptieren, oderfalse , wenn Sie bereit sind, Geschwindigkeit für Richtigkeit zu opfern. Der Standardwert ist true . |
cluster_selection_method |
Zeichenfolge | Geben Sie die Methode an, die zum Auswählen von Clustern aus dem komprimierten Baum verwendet werden soll: eom oderleaf . Der Standardwert ist eom (Überschuss des Massenalgorithmus). |
allow_single_cluster |
Boolesch | Geben Sie true an, wenn Sie Einzelclusterergebnisse zulassen möchten. Der Standardwert ist false . |
p_value |
double | Geben Sie den p value an, der verwendet werden soll, wenn Sie minkowski als Metrik verwenden. Der Standardwert ist 1.5 . |
leaf_size |
Ganze Zahl | Wenn Sie einen Algorithmus für die Leerraumbaumstruktur (boruvka_kdtree oderboruvka_balltree ) verwenden, geben Sie die Anzahl der Punkte in einem Blattknoten der Baumstruktur an. Der Standardwert ist 40 . |
outputValidity |
Boolesch | Geben Sie true oder false an, um zu steuern, ob das Gültigkeitsindexdiagramm in die Modellausgabe eingeschlossen wird. |
outputCondensed |
Boolesch | Geben Sie true oder false an, um zu steuern, ob das komprimierte Baumdiagramm in die Modellausgabe eingeschlossen wird. |
outputSingleLinkage |
Boolesch | Geben Sie true oder false an, um zu steuern, ob das Diagramm "Single Linkage Tree" in die Modellausgabe eingeschlossen wird. |
outputMinSpan |
Boolesch | Geben Sie true oder false an, um zu steuern, ob das Diagramm "Min. Span Tree" in die Modellausgabe eingeschlossen wird. |
is_split |