Translation not up to date
Analiza dyskryminacyjna umożliwia budowanie modelu prognozowego przynależności do grup. Model jest budowany na podstawie funkcji dyskryminacyjnej (lub, dla więcej niż dwóch grup, zestawu funkcji dyskryminacyjnych) na podstawie liniowych kombinacji predyktorów, zapewniających najlepsze rozróżnienie między grupami. Funkcje są generowane z próbki obserwacji, których przynależność do grupy jest znana. Funkcje mogą następnie zostać zastosowane do nowych obserwacji, gdzie znane są miary dla predyktorów, ale nie przynależność do grupy.
Przykład. Operator telekomunikacyjny może zastosować analizę dyskryminacyjną w celu podzielenia klientów na grupy na podstawie danych o wykorzystaniu usług. Dzięki temu możliwe będzie dokonanie oceny potencjalnych klientów i skierowanie oferty do tych, którzy z największym prawdopodobieństwem należą do najbardziej wartościowych grup.
Wymagania. Potrzebna jest najmniej jedna zmienna
wejściowa i dokładnie jedna zmienna przewidywana. Element docelowy musi być zmienną jakościową (z poziomem pomiaru Flag
lub Nominal
) z pamięcią masową typu łańcuchowego lub całkowitoliczbowego. (W razie potrzeby można dokonać konwersji pamięci masowej za pomocą węzła wypełniania lub wyliczeń). Pola ustawione na wartość Both
lub None
są ignorowane. Typy zmiennych używanych w modelu muszą być w pełni zrealizowane jako instancje.
Mocne strony. Zarówno analiza dyskryminacyjna, jak i regresja logistyczna są wartościowymi modelami klasyfikacji. Jednak w analizie dyskryminacyjnej czyni się więcej założeń co do zmiennych wejściowych — np. że mają rozkład normalny i powinny być ilościowe. Analiza daje lepsze wyniki, gdy te założenia są spełnione, zwłaszcza przy małych próbach.