La regressione lineare è una tecnica statistica comune che consente di classificare i record in base ai valori dei campi di input numerici. La regressione lineare rappresenta una linea retta o un piano che riduce al minimo le differenze tra i valori di output previsti e quelli effettivi.
Requisiti. In un modello di regressione lineare è possibile utilizzare solo campi numerici. È necessario disporre di un solo campo obiettivo (con il ruolo impostato su Obiettivo) e uno o più predittori (con il ruolo impostato su Input). I campi con ruolo Entrambi o Nessuno vengono ignorati, così come vengono ignorati i campi non numerici. Se necessario, è possibile ricodificare i campi non numerici utilizzando un nodo Ricava.
Efficacia. I modelli di regressione lineare sono relativamente semplici e danno una formula matematica di facile interpretazione per la generazione delle previsioni. La regressione lineare è una procedura statistica nota da tempo, pertanto le proprietà di questi modelli non presentano difficoltà di comprensione. Inoltre, in genere l'addestramento dei modelli lineari è rapido. Il nodo lineare fornisce metodi di selezione automatica dei campi per eliminare dall'equazione i campi di input non significativi.