Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
Uzel stromu-AS je podobný uzlu CHAID, avšak uzel stromu-AS je navržen tak, aby zpracoval velká data pro vytvoření jednoho stromu a zobrazuje výsledný model ve výstupním prohlížeči. Uzel generuje rozhodovací strom pomocí statistiky chí-kvadrát (CHAID) k identifikaci optimálního rozdělení. Toto použití CHAID může generovat nebinární stromy, což znamená, že některá rozdělení mají více než dvě větve. Cílové a vstupní pole mohou být číselného rozsahu (souvislá) nebo kategorická. Vyčerpávající CHAID je modifikace CHAID, která dělá důkladnější úkol přezkoumání všech možných rozdělení, ale bude trvat déle, než se počítá.
treeas Vlastnosti |
Hodnoty | Popis vlastnosti |
---|---|---|
target |
pole | V uzlu stromu-AS vyžadují modely CHAID jeden cíl a jedno nebo více vstupních polí. Pole frekvence může být také uvedeno. Další informace naleznete v tématu Obecné vlastnosti uzlu modelování . |
method |
chaid exhaustive_chaid |
|
max_depth |
celočíselná hodnota | Maximální hloubka stromu, od 0 do 20. Výchozí hodnota je 5. |
num_bins |
celočíselná hodnota | Používá se pouze v případě, že se data skládá ze souvislých vstupů. Nastavte počet shodných frekvenčních zásobníků, které se mají použít pro vstupy; volby jsou: 2, 4, 5, 10, 20, 25, 50 nebo 100. |
record_threshold |
celočíselná hodnota | Počet záznamů, na kterých se model při sestavování stromu přepne z použití p-hodnot na Effect sizes. Předvolba je 1 000 000; zvýšení nebo snížení je v přírůstcích po 10.000. |
split_alpha |
Číslo | Hladina významnosti pro rozdělení. Hodnota musí být mezi 0.01 a 0.99. |
merge_alpha |
Číslo | Hladina významnosti pro sloučení. Hodnota musí být mezi 0.01 a 0.99. |
bonferroni_adjustment |
příznak | Upravte hodnoty významnosti pomocí metody Bonferroniho. |
effect_size_threshold_cont |
Číslo | Při použití souvislého cíle nastavte prahovou hodnotu velikosti efektu při rozdělení uzlů a slučování kategorií. Hodnota musí být mezi 0.01 a 0.99. |
effect_size_threshold_cat |
Číslo | Nastavte prahovou hodnotu velikosti efektu při rozdělení uzlů a slučování kategorií při použití kategorického cíle. Hodnota musí být mezi 0.01 a 0.99. |
split_merged_categories |
příznak | Povolit opakované posílání sloučených kategorií. |
grouping_sig_level |
Číslo | Používá se k určení toho, jak se formuje skupina uzlů nebo jak jsou identifikovány neobvyklé uzly. |
chi_square |
pearson likelihood_ratio |
Metoda použitá k výpočtu statistiky chí-kvadrát: Pearson nebo Poměr pravděpodobnosti |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
Číslo | Předvolba je 2. Minimálně 1, maximálně 100, v přírůstcích po 1. Hodnota nadřízené větve musí být vyšší než podřízená větev. |
min_child_records_pc |
Číslo | Předvolba je 1. Minimálně 1, maximálně 100, v přírůstcích po 1. |
min_parent_records_abs |
Číslo | Výchozí hodnota je 100. Minimálně 1, maximálně 100, v přírůstcích po 1. Hodnota nadřízené větve musí být vyšší než podřízená větev. |
min_child_records_abs |
Číslo | Výchozí hodnota je 50. Minimálně 1, maximálně 100, v přírůstcích po 1. |
epsilon |
Číslo | Minimální změna očekávané frekvence buněk .. |
max_iterations |
Číslo | Maximum iterací pro konvergenci. |
use_costs |
příznak | |
costs |
strukturované | Strukturovaná vlastnost. Formát je seznam 3 hodnot: skutečná hodnota, předpovězená hodnota a náklady, pokud je tato prognóza chybná. Například: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
Povoleno pouze pro ordinální cíle. Nastavte výchozí hodnoty v matici nákladů. |
calculate_conf |
příznak | |
display_rule_id |
příznak | Přidá pole ve výsledovém výstupu, které uvádí ID pro uzel terminálu, ke kterému je každý záznam přiřazen. |