autoclusterernode, Eigenschaften

Letzte Aktualisierung: 11. Feb. 2025
autoclusterernode, Eigenschaften

Knotensymbol 'Autom. Cluster'Mit dem Knoten "Autom. Cluster" können Sie Clustering-Modelle, die Gruppen und Datensätze mit ähnlichen Merkmalen identifizieren, schätzen und vergleichen. Die Funktionsweise des Knotens gleicht der von anderen Knoten für automatisierte Modellierung, und Sie können in einem einzigen Modellierungsdurchgang mit mehreren Optionskombinationen experimentieren. Modelle können mithilfe grundlegender Messwerte für Filterung und Rangfolge der Nützlichkeit von Clustermodellen verglichen werden, um ein Maß auf der Basis der Wichtigkeit von bestimmten Feldern zu liefern.

Beispiel

node = stream.create("autocluster", "My node")
node.setPropertyValue("ranking_measure", "Silhouette")
node.setPropertyValue("ranking_dataset", "Training")
node.setPropertyValue("enable_silhouette_limit", True)
node.setPropertyValue("silhouette_limit", 5)
Tabelle 1. autoclusternode, Eigenschaften
autoclusternodeEigenschaften Werte Eigenschaftsbeschreibung
evaluation Feld
Hinweis: Nur Knoten "Autom. Cluster". Kennzeichnet das Feld, für das ein Wichtigkeitswert berechnet wird. Alternativ kann verwendet werden, um zu ermitteln, wie gut der Cluster den Wert dieses Felds unterscheidet und wie gut das Modell dieses Feld vorhersagt.
ranking_measure Silhouette Num_clusters Size_smallest_cluster Size_largest_cluster Smallest_to_largest Importance  
ranking_dataset Training Test  
summary_limit Ganze Zahl Anzahl der im Bericht aufzuführenden Modelle. Geben Sie eine Ganzzahl zwischen 1 und 100 an.
enable_silhouette_limit Markierung  
silhouette_limit Ganze Zahl Ganzzahl zwischen 0 und 100.
enable_number_less_limit Markierung  
number_less_limit Zahl Reelle Zahl zwischen 0,0 und 1,0.
enable_number_greater_limit Markierung  
number_greater_limit Zahl Ganzzahl größer als 0.
enable_smallest_cluster_limit Markierung  
smallest_cluster_units Percentage Counts  
smallest_cluster_limit_percentage Zahl  
smallest_cluster_limit_count Ganze Zahl Ganzzahl größer als 0.
enable_largest_cluster_limit Markierung  
largest_cluster_units Percentage Counts  
largest_cluster_limit_percentage Zahl  
largest_cluster_limit_count Ganze Zahl  
enable_smallest_largest_limit Markierung  
smallest_largest_limit Zahl  
enable_importance_limit Markierung  
importance_limit_condition Greater_than Less_than  
importance_limit_greater_than Zahl Ganzzahl zwischen 0 und 100.
importance_limit_less_than Zahl Ganzzahl zwischen 0 und 100.
<algorithm> Markierung Aktiviert oder inaktiviert die Verwendung eines bestimmten Algorithmus.
<algorithm>.<property> Zeichenfolge Legt einen Eigenschaftswert für einen bestimmten Algorithmus fest. Weitere Informationen finden Sie unter Algorithmuseigenschaften festlegen .
number_of_models Ganze Zahl
enable_model_build_time_limit Boolesch (Nur K-Means-, Kohonen-, TwoStep-, SVM-, KNN-, Bayes-Netz- und Entscheidungslistenmodelle.)
Legt ein maximales Zeitlimit für ein Modell fest. Wenn beispielsweise das Training für ein bestimmtes Modell aufgrund einer komplexen Interaktion unerwartet viel Zeit in Anspruch nimmt, wird durch diese Option vermieden, dass das Modell den gesamten Modellierungsdurchlauf aufhält.
model_build_time_limit Ganze Zahl Zeit, die für die Modellerstellung aufgewendet wurde
enable_stop_after_time_limit Boolesch (Nur neuronale Netz-, K-Means-, Kohonen-, TwoStep-, SVM-, KNN-, Bayes-Netz- und C&R Tree-Modelle.)
Stoppt eine Ausführung nach einer angegebenen Anzahl von Stunden. Alle bis zu diesem Zeitpunkt generierten Modelle werden in das Modellnugget aufgenommen, es werden jedoch keine weiteren Modelle erstellt.
stop_after_time_limit double Laufzeitzeitlimit (Stunden).
stop_if_valid_model Boolesch Stoppt eine Ausführung, wenn ein Modell alle Kriterien erfüllt, die in den Verwerfen-Einstellungen angegeben sind.