Eigenschaften von "hdbscannode"
Letzte Aktualisierung: 11. Feb. 2025
HDBSCAN© (Hierarchical Density-Based Spatial Clustering) verwendet nicht überwachtes Lernen zum Suchen von Clustern (oder dicht besetzten Bereichen) eines Datasets. Der HDBSCAN-Knoten in SPSS Modeler stellt die zentralen Funktionen und häufig verwendeten Parameter der HDBSCAN-Bibliothek bereit. Der Knoten wird in Python implementiert und Sie können ihn verwenden, um Ihr Dataset in verschiedene Gruppen aufzuteilen, wenn Sie anfangs noch nicht wissen, was diese Gruppen enthalten.
Eigenschaften |
Datentyp | Eigenschaftsbeschreibung |
---|---|---|
custom_fields | Boolesch | Diese Option weist den Knoten an, die hier angegebenen Feldinformationen anstelle der in einem vorgeordneten Typknoten angegebenen zu verwenden. Geben Sie nach Auswahl dieser Option nach Bedarf die folgenden Felder an. |
|
Feld | Eingabefelder für Clustering. |
|
Boolesch | Geben Sie oder an, um die Hyper-Parameter-Optimierung (HPO) auf der Basis von Rbfopt zu aktivieren oder zu inaktivieren, die automatisch die optimale Kombination von Parametern erkennt, sodass das Modell die erwartete oder niedrigere Fehlerrate in den Stichproben erreicht. Der Standardwert ist . |
|
Ganze Zahl | Die Mindestgröße von Clustern. Geben Sie eine Ganzzahl an. Der Standardwert ist . |
|
Ganze Zahl | Die Anzahl der Stichproben in einer Nachbarschaft für einen Punkt, der als zentraler Punkt betrachtet werden soll. Geben Sie eine Ganzzahl an. Wenn der Wert auf gesetzt ist, wird verwendet. Der Standardwert ist . |
|
Zeichenfolge | Geben Sie an, welcher Algorithmus verwendet werden soll: , , , , oder . Der Standardwert ist . |
|
Zeichenfolge | Geben Sie an, welche Metrik beim Berechnen der Distanz zwischen Instanzen in einem Feature-Array verwendet werden soll: , , , , , , , , , oder . Der Standardwert ist . |
|
Boolesch | Geben Sie an, um eine Zeichenfolge als Clusterbezeichnung zu verwenden, oder , um eine Zahl als Clusterbezeichnung zu verwenden. Der Standardwert ist . |
|
Zeichenfolge | Wenn der Parameter auf gesetzt ist, geben Sie einen Wert für das Präfix der Zeichenfolgebezeichnung an. Das Standardpräfix ist . |
|
Boolesch | Geben Sie an, um einen ungefähren minimalen Spanning Tree zu akzeptieren, oder , wenn Sie bereit sind, Geschwindigkeit für Richtigkeit zu opfern. Der Standardwert ist . |
|
Zeichenfolge | Geben Sie die Methode an, die zum Auswählen von Clustern aus dem komprimierten Baum verwendet werden soll: oder . Der Standardwert ist (Überschuss des Massenalgorithmus). |
|
Boolesch | Geben Sie an, wenn Sie Einzelclusterergebnisse zulassen möchten. Der Standardwert ist . |
|
double | Geben Sie den an, der verwendet werden soll, wenn Sie als Metrik verwenden. Der Standardwert ist . |
|
Ganze Zahl | Wenn Sie einen Algorithmus für die Leerraumbaumstruktur ( oder ) verwenden, geben Sie die Anzahl der Punkte in einem Blattknoten der Baumstruktur an. Der Standardwert ist . |
|
Boolesch | Geben Sie oder an, um zu steuern, ob das Gültigkeitsindexdiagramm in die Modellausgabe eingeschlossen wird. |
|
Boolesch | Geben Sie oder an, um zu steuern, ob das komprimierte Baumdiagramm in die Modellausgabe eingeschlossen wird. |
|
Boolesch | Geben Sie oder an, um zu steuern, ob das Diagramm "Single Linkage Tree" in die Modellausgabe eingeschlossen wird. |
|
Boolesch | Geben Sie oder an, um zu steuern, ob das Diagramm "Min. Span Tree" in die Modellausgabe eingeschlossen wird. |
|
War das Thema hilfreich?
0/1000