El modelo lineal generalizado amplía el modelo lineal general, de manera que la variable dependiente está relacionada linealmente con los factores y las covariables mediante una determinada función de enlace. Además, el modelo permite que la variable dependiente tenga una distribución no normal. Cubre los modelos estadísticos más comunes, como la regresión lineal para respuestas distribuidas normalmente, los modelos logísticos para datos binarios, el modelo lineal de logaritmo para datos de frecuencias, modelos log-log complementarios para datos de supervivencia censurados por intervalos y numerosos modelos estadísticos a través de su formulación general de modelos.
Ejemplos. Una compañía de transporte puede utilizar modelos lineales generalizados para ajustar una regresión de Poisson a las frecuencias de daños de varios tipos de barcos construidos en varios períodos de tiempo. El modelo resultante puede ayudar a determinar cuales son los tipos de barcos más propensos a sufrir daños.
Una compañía de seguros de automóviles puede utilizar modelos lineales generalizados para ajustar una regresión gamma a las reclamaciones por daños de los automóviles. El modelo resultante puede ayudar a determinar los factores que más contribuyen al tamaño de la reclamación.
Los investigadores médicos pueden utilizar modelos lineales generalizados para ajustar una regresión log-log complementario a los datos de supervivencia censurados por intervalos para pronosticar el tiempo que tardará en reaparecer una enfermedad.
Los modelos lineales generalizados funcionan generando una ecuación que relaciona los valores de los campos de entrada con los valores de los campos de salida. Una vez generado el modelo, puede utilizarlo para estimar los valores de los nuevos datos. Para cada registro, se calcula una probabilidad de pertenencia a cada categoría posible de salida. La categoría objetivo con la probabilidad más alta se asigna como el valor de salida predicho para cada registro.
Requisitos. Necesita uno o más campos de entrada y exactamente un campo objetivo (que puede tener un nivel de medición de Continuous
o Flag
) con dos o más categorías. Los tipos de los campos utilizados en el modelo deben estar completamente instanciados.
Puntos fuertes. El modelo lineal generalizado es extremadamente flexible, pero el proceso de selección de la estructura del modelo no está automatizado y, por tanto, requiere cierta familiaridad con los datos que no es necesaria en los algoritmos de "caja negra".