La regresión lineal es una técnica de estadístico común para clasificar los registros en función los valores de los campos de entrada numérica. La regresión lineal se ajusta a una línea recta o una superficie que minimiza las discrepancias entre los valores de resultados predichos y reales.
Requisitos. Sólo se pueden utilizar campos numéricos en un modelo de regresión. Debe tener exactamente un campo objetivo (con el rol establecido en Target
) y uno o más predictores (con el rol establecido en Input
). Los campos con un rol de Both
o None
se ignoran, al igual que los campos no numéricos. (Si
es necesario, los campos no numéricos se pueden recodificar mediante un nodo Derivar.)
Puntos fuertes. Los modelos de regresión son relativamente simples y proporcionan una fórmula matemática fácil de interpretar para la creación de predicciones. Debido a que el modelado de regresión es un procedimiento estadístico consolidado desde hace tiempo, las propiedades de estos modelos se conocen con mucho detalle. Normalmente, los modelos de regresión se entrenan muy rápidamente. El nodo Regresión proporciona métodos para la selección automática de campos con el fin de eliminar de la ecuación los campos de entrada no significativos.
yes
/no
o churn
/don't churn
, se puede utilizar la regresión logística como alternativa. La regresión logística también admite las entradas no numéricas, por lo que no es necesario recodificar estos campos. Consulte Nodo logístico para obtener más información.