Translation not up to date
Uzel stromu AS může být použit s daty v distribuovaném prostředí. Pomocí tohoto uzlu můžete rozhodnout o sestavení rozhodovacích stromů pomocí modelu CHAID nebo Vyčerpávající CHAID.
CHAID nebo chí-kvadrát automatická detekce interakcí je klasifikační metodou pro sestavení rozhodovacích stromů pomocí statistiky chí kvadrát pro identifikaci optimálních dělení.
CHAID nejprve zkoumá křížové tabulky mezi každým ze vstupních polí a výsledku a testy pro významnost pomocí testu nezávislosti chí kvadrát. Je-li více než jeden z těchto vztahů statisticky významný, CHAID vybere vstupní pole, které je nejvíce významné (nejmenší hodnota p
). Má-li vstup více než dvě kategorie, jsou porovnávány a kategorie, které nevykazují žádné rozdíly v výsledku, se sbalí dohromady. To se provádí postupně spojující dvojice kategorií zobrazující nejméně významný rozdíl. Tato kategorie-sloučení se zastaví, když se všechny zbývající kategorie liší na určené úrovni testování. Pro nominální vstupní pole lze sloučit všechny kategorie; pro pořadové číslo lze sloučit pouze souvislé kategorie.
Vyčerpávající CHAID je modifikace CHAID, která dělá důkladnější úlohu zkoumání všech možných rozdělení pro každý prediktor, ale trvá déle.
Požadavky. Cílové a vstupní pole mohou být spojité nebo kategoriální; uzly lze rozdělit do dvou nebo více podskupin na každé úrovni. Každé pořadové pole použité v modelu musí mít číselnou paměť (nikoli řetězec). Je-li to nutné, použijte k jejich převedení reklasifikujte uzel.
Silné stránky. CHAID může generovat nebinární stromy, což znamená, že některá rozdělení mají více než dvě větve. Proto má tendenci vytvořit širší strom, než jsou binární rostoucí metody. CHAod funguje pro všechny typy vstupů a přijímá jak váhy případu, tak i proměnné frekvence.