La régression linéaire est une technique statistique ordinaire de classification des enregistrements sur la base des valeurs des champs d'entrée numériques. La régression linéaire correspond à une ligne droite ou à une surface qui minimise les écarts entre les valeurs prédites et les valeurs réelles des résultats.
Conditions requises. Seuls les champs numériques sont autorisés dans un modèle de régression. Vous devez avoir exactement un champ cible (avec le rôle défini sur Target
) et un ou plusieurs prédicteurs (avec le rôle défini sur Input
). Les champs ayant le rôle Both
ou None
sont ignorés, tout comme les champs non numériques. (Si
nécessaire, les champs non numériques peuvent être recodés grâce à un noeud Dériver.)
Force. Les modèles de régression sont relativement simples et produisent une formule mathématique de génération de prévisions pouvant facilement être interprétée. Dans la mesure où la modélisation de régression est une technique statistique ancienne, les propriétés des modèles qu'elle génère sont bien connues. D'autre part, leur apprentissage est très rapide. Le noeud Régression contient des méthodes de sélection automatique des champs, ce qui permet d'éliminer de l'équation les champs d'entrée non pertinents.
yes
/no
ou churn
/don't churn
, la régression logistique peut être utilisée comme alternative. La régression logistique offre également une prise en charge des entrées non numériques, supprimant ainsi la nécessité de recoder ces champs. Pour plus d'informations, voir Noeud logistique .