La régression linéaire est une technique statistique ordinaire de classification des enregistrements sur la base des valeurs des champs d'entrée numériques. La régression linéaire correspond à une ligne droite ou à une surface qui minimise les écarts entre les valeurs prédites et les valeurs réelles des résultats.
Conditions requises. Seuls les champs numériques sont autorisés dans un modèle de régression linéaire. Vous devez avoir exactement un champ cible (avec le rôle défini sur Cible) et un ou plusieurs prédicteurs (avec le rôle défini sur Entrée). Les champs avec un rôle de type Les deux ou Aucun sont ignorés, tout comme les champs non numériques. (Si nécessaire, les champs non numériques peuvent être recodés grâce à un noeud Dériver.)
Force. Les modèles de régression linéaire sont relativement simples et produisent une formule mathématique de génération de prévisions pouvant facilement être interprétée. Dans la mesure où la régression linéaire est une technique statistique ancienne, les propriétés des modèles qu'elle génère sont bien connues. D'autre part, leur apprentissage est très rapide. Le noeud linéaire contient des méthodes de sélection automatique des champs, ce qui permet d'éliminer de l'équation les champs d'entrée non pertinents.