Le noeud Tree-AS peut être utilisé avec les données dans un environnement distribué. Dans ce noeud, vous pouvez choisir de générer des arbres de décision à l'aide d'un modèle CHAID ou CHAID exhaustif.
CHAID (Chi-squared Automatic Interaction Detection) est une méthode de classification permettant de créer des arbres de décisions à l'aide de statistiques du khi-deux, afin d'identifier les divisions optimales.
CHAID vérifie d'abord les tableaux croisés entre chaque champ d'entrée, ainsi que les résultats et les tests de signification par le biais d'un test d'indépendance Khi-deux. Si plusieurs de ces relations s'avèrent significatives d'un point de vue statistique, CHAID sélectionne le champ d'entrée le plus significatif (valeur p
minimale). Si une valeur d'entrée possède plusieurs catégories, celles-ci sont comparées. Les catégories dont les résultats sont identiques sont réduites simultanément. Cette opération est effectuée en joignant la paire de catégories qui présente la plus faible différence de signification. Ce processus de fusion de catégories s'interrompt si toutes les autres catégories s'avèrent différentes au niveau de test indiqué. Pour les champs d'entrée nominaux, les catégories peuvent être fusionnées. Pour un ensemble d'ordinaux, seules les catégories contiguës peuvent l'être.
La méthode Exhaustive CHAID correspond à une modification du CHAID qui examine plus en profondeur toutes les divisions possibles pour chaque prédicteur, mais dont les calculs sont plus longs.
Conditions requises. Les champs cible et d'entrée peuvent être des champs continus ou catégoriels. Les noeuds peuvent être divisés en plusieurs sous-groupes à chaque niveau. Les champs ordinaux utilisés dans le modèle doivent disposer d'un stockage numérique (et non d'une chaîne). Si nécessaire, utilisez le noeud Recoder pour les convertir.
Force. CHAID peut générer des arbres non binaires, ce qui implique que certaines divisions possèdent plusieurs branches. Par conséquent, cette méthode a tendance à créer un arbre plus large que les méthodes de développement binaire. CHAID s'applique à tous les types d'entrées, et accepte les pondérations d'observation et les variables de fréquence.