Translation not up to date
Węzeł Dobór predyktorów pomaga zidentyfikować pola, które są najważniejsze w przewidywaniu określonego wyniku. W zestawie setek lub nawet tysięcy predyktorów węzeł Dobór predyktorów monitoruje, szereguje i wybiera predyktory, które mogą być najważniejsze. Docelowo, można skończyć z szybszym, bardziej wydajnym modelem-takim, który wykorzystuje mniej predyktorów, działa szybciej, i może być łatwiej zrozumieć.
Dane użyte w tym przykładzie reprezentują hurtownię danych dla hipotetycznej firmy telefonicznej i zawierają informacje na temat odpowiedzi na specjalną promocję przez 5000 klientów firmy. Dane obejmują wiele pól, które zawierają statystyki dotyczące wieku, zatrudnienia, dochodów i wykorzystania telefonu. Trzy zmienne przewidywane przedstawiają dane, czy klient odpowiedział na każdą z ofert. Firma chce użyć tych danych, aby lepiej przewidzieć, którzy klienci najprawdopodobniej odpowiedzą na podobne oferty w przyszłości.
W tym przykładzie używany jest przepływ o nazwie Screening Predictors(Predyktory), dostępny w przykładowym projekcie zaimportowano wcześniej. Plik danych to customer_dbase.csv.
- Bez wyboru predyktorów. Wszystkie zmienne predyktorów w zbiorze danych są używane jako dane wejściowe dla drzewa CHAID.
- Z opcją wyboru opcji. Węzeł Dobór predyktorów służy do wyboru najlepszych 10 predyktorów. Są one następnie danymi wejściowymi drzewa CHAID.
Porównując dwa wynikowe modele drzewa, możemy zobaczyć, jak selekcja funkcji może przynieść efektywne rezultaty.