La régression Cox crée un modèle prédictif pour les données concernant le temps écoulé jusqu'à un événement. Le modèle génère une fonction de survie qui prévoie la probabilité d'occurrence de l'événement étudié à un instant t
donné pour les valeurs fournies pour les prédicteurs. La forme de la fonction de survie et les coefficients de régression des prédicteurs sont estimés à partir de sujets observés ; le modèle peut alors s'appliquer à de nouvelles observations ayant des mesures pour les variables prédicteur.
Notez que les informations provenant de sujets censurés, autrement dit celles qui ne font pas état de l'événement en question pendant la durée de l'observation, contribuent utilement à l'estimation du modèle.
Exemple. Dans le cadre de ses efforts visant à réduire l'attrition des clients, une société de télécommunications s'intéresse à la modélisation du délai d'attrition afin de déterminer les facteurs associés aux clients qui basculent rapidement vers un autre service. A cette fin, un échantillon aléatoire de clients est sélectionné, et leur temps passé en tant que clients (qu'ils soient ou non encore des clients actifs) et différents champs démographiques sont extraits de la base de données.
Flag
, avec un stockage de type chaîne ou entier. (Le stockage peut être converti à l'aide d'un noeud Filler ou Calculer si nécessaire.) Les zones définies sur Both
ou None
sont ignorées. Les types des champs utilisés dans ce modèle doivent être complètement instanciés. La durée de survie peut être tout champ numérique.Dates et heures. Les champs Date & Heure ne peuvent pas être utilisés pour définir directement la durée de survie. Si vous avez des champs Date & Heure, vous devez les utiliser pour créer un champ contenant des durées de survie basées sur la différence entre la date d'entrée dans l'étude et la date d'observation.
Analyse Kaplan-Meier. La régression de Cox peut être effectuée sans champ d'entrée. Elle est semblable à l'analyse Kaplan-Meier.