Translation not up to date
QUEST-nebo Rychlý, nepředpojatý, efektivní statistický strom-je binární klasifikační metoda pro vytváření rozhodovacích stromů. Hlavní motivací v jejím vývoji bylo zkrácení doby zpracování potřebné pro rozsáhlé analýzy jazyka C & R, a to buď s mnoha proměnnými, nebo s mnoha případy. Druhým cílem QUEST bylo snížení tendence nalézt ve stromových metodách třídění, aby upřednostnila vstupy, které umožňují větší dělení, tj. vstupní pole typu Continuous (číselný rozsah), nebo ty, které mají mnoho kategorií.
- QUEST používá pořadí pravidel na základě testů významnosti k vyhodnocení vstupních polí na uzlu. Pro účely výběru může být třeba na každém vstupu na uzlu provést alespoň jeden test. Na rozdíl od stromu C & R se všechna rozdělení nekontrolují a na rozdíl od stromů C & R a CHAID nejsou kombinace kategorií testovány při vyhodnocování vstupního pole pro výběr. Tím se urychlí analýza.
- Rozdělení se určí spuštěním kvadratické analýzy diskriminantů s použitím vybraného vstupu na skupinách vytvořených cílovými kategoriemi. Tato metoda opět vede ke zlepšení rychlosti při vyčerpávajícím hledání (C & R Tree) k určení optimálního rozdělení.
Požadavky. Vstupní pole mohou být spojitá (číselné rozsahy), ale cílové pole musí být kategorické. Všechny rozdělení jsou binární. Pole váhy nelze použít. Jakákoli ordinální (seřazená sada) polí použitá v modelu musí mít numerickou paměť (ne řetězec). V případě potřeby lze k jejich převedení použít uzel Reklasificassify.
Silné stránky. Podobně jako CHAID, ale na rozdíl od stromu C & R, QUEST používá statistické testy k rozhodnutí, zda se použije vstupní pole nebo ne. Odděluje také otázky výběru a rozdělení vstupu, přičemž uplatňují různá kritéria na každou z nich. To je v rozporu s CHAID, ve kterém výsledek statistického testu, který určuje výběr proměnné, také produkuje rozdělení. Podobně platí, že strom C & R používá změnové měřítko na výběr vstupního pole a pro určení rozdělení.