Die Diskriminanzanalyse dient zur Erstellung eines Vorhersagemodells der Gruppenzugehörigkeit. Das Modell besteht aus einer Diskriminanzfunktion (oder, bei mehr als zwei Gruppen, einem Set von Diskriminanzfunktionen) auf der Grundlage derjenigen linearen Kombinationen der Prädiktorvariablen, die die beste Diskriminanz zwischen den Gruppen ergeben. Die Funktionen werden aus einer Stichprobe der Fälle generiert, bei denen die Gruppenzugehörigkeit bekannt ist. Diese Funktionen können dann auf neue Fälle mit Messungen für die Prädiktorvariablen, aber unbekannter Gruppenzugehörigkeit angewandt werden.
Beispiel. Ein Telekommunikationsunternehmen kann mithilfe der Diskriminanzanalyse Kunden anhand der Nutzungsdaten in Gruppen einteilen. Dadurch kann das Unternehmen potenzielle Kunden scoren und sich gezielt denjenigen zuwenden, die mit der größten Wahrscheinlichkeit zu den einträglichsten Gruppen gehören.
Anforderungen. Es werden mindestens ein Eingabefeld und genau ein Zielfeld benötigt. Bei dem Ziel muss es sich um ein kategoriales Feld (mit dem Messniveau Flag
oder Nominal
) mit dem Speichertyp "Zeichenfolge" oder "Ganze Zahl" handeln. (Speicher kann, falls erforderlich, mit einem Filler-oder Ableitungsknoten konvertiert werden.) Felder, die auf Both
oder None
gesetzt sind, werden ignoriert. Bei den im Modell verwendeten Feldern müssen die Typen vollständig instanziiert sein.
Stärken. Sowohl die Diskriminanzanalyse als auch die logistische Regression eignen sich jeweils als Klassifizierungsmodell. Die Diskriminanzanalyse geht jedoch von mehr Annahmen zu den Eingabefeldern aus, beispielsweise davon, dass sie normal verteilt sind und stetig sein sollten und dass sie zu besseren Ergebnissen führen, wenn diese Anforderungen erfüllt sind, besonders, wenn der Stichprobenumfang klein ist.