Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12. 1. 2023
Uzel K-Means seskupuje datová sada do odlišných skupin (nebo klastrů). Metoda definuje pevný počet klastrů, iterativně přiřazuje záznamy do klastrů a upravuje centra klastru, dokud další zpřesnění již nezlepší model. Místo toho, abyste se pokusili předpovědět výsledek, k-znamená použít proces známý pod názvem unsupervised learning k odhalení vzorců v sadě vstupních polí.
Příklad
node = stream.create("kmeans", "My node")
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Cholesterol", "BP", "Drug", "Na", "K", "Age"])
# "Model" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Kmeans_allinputs")
node.setPropertyValue("num_clusters", 9)
node.setPropertyValue("gen_distance", True)
node.setPropertyValue("cluster_label", "Number")
node.setPropertyValue("label_prefix", "Kmeans_")
node.setPropertyValue("optimize", "Speed")
# "Expert" tab
node.setPropertyValue("mode", "Expert")
node.setPropertyValue("stop_on", "Custom")
node.setPropertyValue("max_iterations", 10)
node.setPropertyValue("tolerance", 3.0)
node.setPropertyValue("encoding_value", 0.3)
kmeansnode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
inputs |
[field1 ... fieldN] | K-znamená modely provedení klastrové analýzy na sadě vstupních polí, ale nepoužívat cílové pole. Pole Váha a frekvence se nepoužívají. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
num_clusters |
Číslo | |
gen_distance |
Příznak | |
cluster_label |
String Number |
|
label_prefix |
řetězec | |
mode |
Simple Expert |
|
stop_on |
Default Custom |
|
max_iterations |
Číslo | |
tolerance |
Číslo | |
encoding_value |
Číslo | |
optimize |
Speed Memory |
Uvádí, zda by měla být budova modelu optimalizována pro rychlost nebo pro paměť. |