La procédure Modèles linéaires généralisés développe le modèle linéaire général de sorte que la variable dépendante soit linéairement reliée aux facteurs et covariables via une fonction de lien précise. En outre, le modèle permet à la variable dépendante de suivre une distribution non normale. Il couvre des modèles statistiques largement utilisés comme la régression linéaire pour les réponses normalement distribuées, les modèles logistiques pour les données binaires, les modèles log-linéaires pour les données de décompte, les modèles log-log complémentaires pour les données de survie avec censure par intervalle, ainsi que de nombreux autres modèles statistiques via sa formulation de modèles très générale.
Exemples. Une compagnie de navigation peut utiliser des modèles linéaires généralisés pour ajuster une régression de Poisson au nombre de détériorations subies par plusieurs types de bateaux construits à des périodes différentes. Le modèle qui en résulte peut permettre de déterminer quels types de bateaux sont plus enclins aux détériorations.
Une compagnie d'assurance automobile peut utiliser des modèles linéaires généralisés pour ajuster une régression gamma à des actions en indemnisation pour des voitures. Le modèle qui en résulte peut permettre de déterminer les facteurs qui ont le plus d'influence sur le nombre de déclarations.
Des chercheurs en médecine peuvent utiliser des modèles linéaires généralisés pour ajuster une régression log-log complémentaire des données de survie censurées par intervalle pour prévoir la récurrence d'un état médical.
Les modèles linéaires généralisés créent une équation qui lie les valeurs de champ d'entrée aux valeurs de champ de sortie. Une fois le modèle généré, vous pouvez l'utiliser pour estimer les valeurs des nouvelles données. Pour chaque enregistrement, une probabilité d'appartenance est calculée pour chaque catégorie de sortie. La catégorie cible présentant la plus forte probabilité devient la valeur de sortie prédite de l'enregistrement.
Conditions requises. Vous avez besoin d'un ou de plusieurs champs d'entrée et d'exactement un champ cible (qui peut avoir un niveau de mesure Continuous
ou Flag
) avec deux catégories ou plus. Les types des champs utilisés dans ce modèle doivent être complètement instanciés.
Force. Le modèle linéaire généralisé est extrêmement souple, mais le processus consistant à choisir la structure du modèle n'est pas automatisé et requiert donc une connaissance des données plus importante qu'avec les algorithmes de type "boîte noire".