Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel TwoStep používá dvoustupňové klastrovací metodu. Prvním krokem je jednotlivý průchod dat, aby se nezpracovaná vstupní data komprimovali do spravovatelné sady podklastrů. Druhý krok používá hierarchickou metodu klastrování k postupnému sloučení podklastrů na větší a větší klastry. TwoStep má výhodu, že automaticky odhadne optimální počet klastrů pro data školení. Umožňuje efektivně pracovat se smíšenými typy polí a velkými datovými sadami.
Příklad
node = stream.create("twostep", "My node")
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("inputs", ["Age", "K", "Na", "BP"])
node.setPropertyValue("partition", "Test")
node.setPropertyValue("use_model_name", False)
node.setPropertyValue("model_name", "TwoStep_Drug")
node.setPropertyValue("use_partitioned_data", True)
node.setPropertyValue("exclude_outliers", True)
node.setPropertyValue("cluster_label", "String")
node.setPropertyValue("label_prefix", "TwoStep_")
node.setPropertyValue("cluster_num_auto", False)
node.setPropertyValue("max_num_clusters", 9)
node.setPropertyValue("min_num_clusters", 3)
node.setPropertyValue("num_clusters", 7)
twostepnode Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
inputs |
[field1 ... fieldN] | Modely TwoStep používají seznam vstupních polí, ale žádný cíl. Pole Váha a frekvence nejsou rozpoznána. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
standardize |
příznak | |
exclude_outliers |
příznak | |
percentage |
Číslo | |
cluster_num_auto |
příznak | |
min_num_clusters |
Číslo | |
max_num_clusters |
Číslo | |
num_clusters |
Číslo | |
cluster_label |
String Number |
|
label_prefix |
řetězec | |
distance_measure |
Euclidean Loglikelihood |
|
clustering_criterion |
AIC BIC |