La regressione lineare è una tecnica statistica comune che consente di classificare i record in base ai valori dei campi di input numerici. La regressione lineare rappresenta una linea retta o un piano che riduce al minimo le differenze tra i valori di output previsti e quelli effettivi.
Requisiti. In un modello di regressione è possibile utilizzare solo
campi numerici. È necessario disporre esattamente di un campo obiettivo (con il ruolo impostato su Target
) e di uno o più predittori (con il ruolo impostato su Input
). I campi con ruolo Both
o None
vengono ignorati, così come i campi non numerici. Se
necessario, è possibile ricodificare i campi non numerici utilizzando un nodo
Ricava.
Efficacia. I modelli di regressione sono relativamente semplici e danno una formula matematica di facile interpretazione per la generazione delle previsioni. La creazione di modelli di regressione è una procedura statistica nota da tempo, pertanto le proprietà di questi modelli non presentano difficoltà di comprensione. Inoltre, in genere l'addestramento dei modelli di regressione è rapido. Il nodo Regressione fornisce metodi di selezione automatica dei campi per eliminare dall'equazione i campi di input non significativi.
yes
/no
o churn
/don't churn
, la regressione logistica può essere utilizzata come alternativa. La regressione logistica inoltre supporta gli input non numerici, eliminando la necessità di ricodificare questi campi. Per ulteriori informazioni, vedi Nodo logistico .