Das GLE-Modell gibt die abhängige Variable an, die über eine angegebene Verknüpfungsfunktion in einer linearen Beziehung zu den Faktoren und Kovariaten steht. Außerdem ist es mit diesem Modell möglich, dass die abhängige Variable eine von der Normalverteilung abweichende Verteilung aufweist. Es deckt durch seine sehr allgemein gehaltene Modellformulierung häufig verwendete statistische Modelle ab, wie beispielsweise die lineare Regression für normalverteilte Antworten, logistische Modelle für binäre Daten und loglineare Modelle für Häufigkeitsdaten, Modelle vom Typ "Log-Log komplementär" für intervallzensierte Überlebensdaten sowie viele andere statistische Modelle.
Beispiele. Eine Reederei kann verallgemeinerte lineare Modelle verwenden, um eine Poisson-Regression an die Anzahl von Beschädigungen für mehrere Schiffstypen anzupassen, die in verschiedenen Zeiträumen gebaut wurden. Anhand des daraus hervorgehenden Modells kann bestimmt werden, welche Schiffstypen besonders anfällig für Schäden sind.
Ein KFZ-Versicherungsunternehmen kann verallgemeinerte lineare Modelle verwenden, um eine Gammaregression an die Schadensersatzansprüche für Autos anzupassen. Anhand des daraus hervorgehenden Modells können die Faktoren bestimmt werden, die am meisten zur Anspruchshöhe beitragen.
Mediziner können mithilfe von verallgemeinerten linearen Modellen eine komplementäre Log-Log-Regression an intervallzensierte Überlebensdaten anpassen, um die Dauer bis zum Wiederauftreten einer Erkrankung vorherzusagen.
Bei GLE-Modellen wird eine Gleichung erstellt, die die Werte der Eingabefelder mit den Werten der Ausgabefelder in Bezug setzt. Nachdem das Modell generiert wurde, können Sie es zum Schätzen von Werten für neue Daten verwenden.
Für ein kategoriales Ziel wird für jeden Datensatz eine Wahrscheinlichkeit der Zugehörigkeit für jede mögliche Ausgabekategorie berechnet. Die Zielkategorie mit der höchsten Wahrscheinlichkeit wird als vorhergesagter Ausgabewert für den betreffenden Datensatz zugewiesen.
Anforderungen. Sie benötigen mindestens ein Eingabefeld und genau ein Zielfeld (das ein Messniveau von Continuous
, Categorical
oder Flag
aufweisen kann) mit mindestens zwei Kategorien. Bei den im Modell verwendeten Feldern müssen die Typen vollständig instanziiert sein.