Regressionsknoten
Die lineare Regression ist eine übliche statistische Methode zum Klassifizieren von Datensätzen auf der Basis der Werte von numerischen Eingabefeldern. Die lineare Regression passt zu einer geraden Linie oder Fläche, die die Diskrepanzen zwischen vorhergesagten und tatsächlichen Ausgangswerten minimiert.
Anforderungen. In Regressionsmodellen können nur numerische Felder verwendet werden. Sie müssen genau ein Zielfeld (mit der Rolle
) und mindestens einen Prädiktor (mit der Rolle Target
) haben. Felder mit der Rolle Input
oder Both
werden ebenso ignoriert wie nicht numerische Felder. (Nicht numerische Felder können, falls erforderlich, mithilfe eines Ableitungsknotens umcodiert werden.)None
Stärken. Regressionsmodelle sind relativ einfach und bieten eine leicht zu interpretierende mathematische Formel für das Generieren von Vorhersagen. Da die Regressionsmodellierung ein seit langem etabliertes statistisches Verfahren ist, liegen umfassende Kenntnisse über die Eigenschaften dieser Modelle vor. Regressionsmodelle lassen sich üblicherweise sehr schnell trainieren. Der Regressionsknoten bietet Methoden für die automatische Feldauswahl zum Entfernen nicht signifikanter Eingabefelder aus der Gleichung.
yes
/no
oder churn
/don't churn
), kann alternativ die logistische Regression verwendet werden. Die logistische Regression bietet außerdem Unterstützung für nicht numerische Eingaben, sodass eine Umcodierung dieser Felder nicht mehr erforderlich ist. Weitere Informationen finden Sie unter Logistikknoten .