kmeansnode, Eigenschaften
Letzte Aktualisierung: 11. Feb. 2025
Der K-Means-Knoten teilt das Dataset in unterschiedliche Gruppen (oder Cluster) auf. Bei dieser Methode wird eine festgelegte Anzahl von Clustern definiert, den Clustern werden iterativ Datensätze zugewiesen und die Clusterzentren werden angepasst, bis eine weitere Verfeinerung keine wesentliche Verbesserung des Modells mehr darstellen würde. Statt zu versuchen, ein Ergebnis vorherzusagen, versucht K-Means mithilfe eines als "nicht überwachtes Lernen" bezeichneten Verfahrens Muster im Set der Eingabefelder zu entdecken.
Beispiel
node = stream.create("kmeans", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Cholesterol", "BP", "Drug", "Na", "K", "Age"])
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Kmeans_allinputs")
node.setPropertyValue("num_clusters", 9)
node.setPropertyValue("gen_distance", True)
node.setPropertyValue("cluster_label", "Number")
node.setPropertyValue("label_prefix", "Kmeans_")
node.setPropertyValue("optimize", "Speed")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("stop_on", "Custom")
node.setPropertyValue("max_iterations", 10)
node.setPropertyValue("tolerance", 3.0)
node.setPropertyValue("encoding_value", 0.3)
Eigenschaften |
Werte | Eigenschaftsbeschreibung |
---|---|---|
|
[field1 ... fieldN] | K-Means-Modelle führen eine Clusteranalyse an einer Menge von Eingabefeldern durch, verwenden jedoch kein Zielfeld. Gewichtungs- und Häufigkeitsfelder werden nicht verwendet. Weitere Informationen finden Sie unter Allgemeine Eigenschaften von Modellierungsknoten . |
|
Zahl | |
|
Markierung | |
|
|
|
|
Zeichenfolge | |
|
|
|
|
|
|
|
Zahl | |
|
Zahl | |
|
Zahl | |
|
|
Gibt an, ob die Modellerstellung für Geschwindigkeit oder Speicher optimiert werden soll. |
War das Thema hilfreich?
0/1000