Die lineare Regression ist eine übliche statistische Methode zum Klassifizieren von Datensätzen auf der Basis der Werte von numerischen Eingabefeldern. Die lineare Regression passt zu einer geraden Linie oder Fläche, die die Diskrepanzen zwischen vorhergesagten und tatsächlichen Ausgangswerten minimiert.
Anforderungen. In Regressionsmodellen können nur numerische Felder verwendet werden. Sie müssen genau ein Zielfeld (mit der Rolle Target
) und mindestens einen Prädiktor (mit der Rolle Input
) haben. Felder mit der Rolle Both
oder None
werden ebenso ignoriert wie nicht numerische Felder. (Nicht numerische Felder können, falls erforderlich, mithilfe eines Ableitungsknotens umcodiert werden.)
Stärken. Regressionsmodelle sind relativ einfach und bieten eine leicht zu interpretierende mathematische Formel für das Generieren von Vorhersagen. Da die Regressionsmodellierung ein seit langem etabliertes statistisches Verfahren ist, liegen umfassende Kenntnisse über die Eigenschaften dieser Modelle vor. Regressionsmodelle lassen sich üblicherweise sehr schnell trainieren. Der Regressionsknoten bietet Methoden für die automatische Feldauswahl zum Entfernen nicht signifikanter Eingabefelder aus der Gleichung.
yes
/no
oder churn
/don't churn
), kann alternativ die logistische Regression verwendet werden. Die logistische Regression bietet außerdem Unterstützung für nicht numerische Eingaben, sodass eine Umcodierung dieser Felder nicht mehr erforderlich ist. Weitere Informationen finden Sie unter Logistikknoten .