Le noeud Tree-AS peut être utilisé avec les données dans un environnement distribué. Dans ce noeud, vous pouvez choisir de générer des arbres de décision à l'aide d'un modèle CHAID ou CHAID exhaustif.
CHAID (Chi-squared Automatic Interaction Detection) est une méthode de classification permettant de créer des arbres de décisions à l'aide de statistiques du khi-deux, afin d'identifier les divisions optimales.
CHAID vérifie d'abord les tableaux croisés entre chaque champ d'entrée, ainsi que les résultats et les tests de signification par le biais d'un test d'indépendance Khi-deux. Si plusieurs de ces relations s'avèrent significatives d'un point de vue statistique, CHAID sélectionne le champ d'entrée le plus significatif (valeur p minimale). Si une valeur d'entrée possède plusieurs catégories, celles-ci sont comparées. Les catégories dont les résultats sont identiques sont réduites simultanément. Cette opération est effectuée en joignant la paire de catégories qui présente la plus faible différence de signification. Ce processus de fusion de catégories s'interrompt si toutes les autres catégories s'avèrent différentes au niveau de test indiqué. Pour les champs d'entrée nominaux, les catégories peuvent être fusionnées. Pour un ensemble d'ordinaux, seules les catégories contiguës peuvent l'être.
La méthode Exhaustive CHAID correspond à une modification du CHAID qui examine plus en profondeur toutes les divisions possibles pour chaque prédicteur, mais dont les calculs sont plus longs.
Conditions requises. Les champs cible et d'entrée peuvent être des champs continus ou catégoriels. Les noeuds peuvent être divisés en plusieurs sous-groupes à chaque niveau. Les champs ordinaux utilisés dans le modèle doivent disposer d'un stockage numérique (et non d'une chaîne). Si nécessaire, utilisez le noeud Recoder pour les convertir.
Force. CHAID peut générer des arbres non binaires, ce qui implique que certaines divisions possèdent plusieurs branches. Par conséquent, cette méthode a tendance à créer un arbre plus large que les méthodes de développement binaire. CHAID s'applique à tous les types d'entrées, et accepte les pondérations d'observation et les variables de fréquence.
À propos des cookies sur ce sitePour fonctionner correctement, nos sites Internet nécessitent certains cookies (requis). En outre, d'autres cookies peuvent être utilisés avec votre consentement pour analyser l'utilisation d'un site, améliorer l'expérience des utilisateurs et à des fins publicitaires.Pour plus informations, passez en revue vos options de préférences en préférences en matière de cookies. En visitant notre site Web, vous acceptez que nous traitions les informations comme décrit dans ladéclaration de confidentialité d’IBM.Pour faciliter la navigation, vos préférences en matière de cookie seront partagées dans les domaines Web d'IBM énumérés ici.