0 / 0
Go back to the English version of the documentation
Uzel CHAID
Last updated: 07. 7. 2023
Uzel CHAID (SPSS Modeler)

CHAID nebo chí-kvadrát automatická detekce interakcí je klasifikační metodou pro sestavení rozhodovacích stromů pomocí statistiky chí kvadrát pro identifikaci optimálních dělení.

CHAID nejprve zkoumá křížové tabulky mezi každým ze vstupních polí a výsledku a testy pro významnost pomocí testu nezávislosti chí kvadrát. Je-li více než jeden z těchto vztahů statisticky významný, CHAID vybere vstupní pole, které je nejvíce významné (nejmenší hodnota p ). Má-li vstup více než dvě kategorie, jsou porovnávány a kategorie, které nevykazují žádné rozdíly v výsledku, se sbalí dohromady. To se provádí postupně spojující dvojice kategorií zobrazující nejméně významný rozdíl. Tato kategorie-sloučení se zastaví, když se všechny zbývající kategorie liší na určené úrovni testování. Pro nominální vstupní pole lze sloučit všechny kategorie; pro pořadové číslo lze sloučit pouze souvislé kategorie.

Vyčerpávající CHAID je modifikace CHAID, která dělá důkladnější úlohu zkoumání všech možných rozdělení pro každý prediktor, ale trvá déle.

Požadavky. Cílové a vstupní pole mohou být spojité nebo kategoriální; uzly lze rozdělit do dvou nebo více podskupin na každé úrovni. Každé pořadové pole použité v modelu musí mít číselnou paměť (nikoli řetězec). V případě potřeby lze k jejich převedení použít uzel Reklasificassify.

Silné stránky. Na rozdíl od uzlů v jazycích C & R a QUEST může CHAID generovat nebinární stromy, což znamená, že některá rozdělení mají více než dvě větve. Proto má tendenci vytvořit širší strom, než jsou binární rostoucí metody. CHAod funguje pro všechny typy vstupů a přijímá jak váhy případu, tak i proměnné frekvence.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more