QUEST (ou Quick, Unbiased, Efficient Statistical Tree, arbre statistique efficace, non biaisé et rapide) est une méthode de classification binaire permettant de créer des arbres de décisions. L'une des principales raisons pour lesquelles cette méthode a été développée était de réduire le temps de traitement nécessaire aux analyses C&RT importantes, qui utilisaient alors de nombreuses variables ou observations. QUEST avait également pour objectif de limiter la tendance, observée parmi les méthodes d'arbre de classification, à favoriser les entrées autorisant un nombre supérieur de divisions, à savoir des champs d'entrée continus (intervalle numérique) ou ceux dotés de nombreuses catégories.
- QUEST utilise une séquence de règles, basée sur des tests de signification, pour évaluer les champs d'entrée d'un noeud. A des fins de sélection, vous pouvez être amené à n'effectuer qu'un seul test sur chaque entrée d'un noeud. Contrairement à Arbre C&RT, cette méthode ne vérifie pas toutes les divisions et, à la différence de C&RT et CHAID, elle ne teste pas non plus les combinaisons de catégories lorsqu'un champ d'entrée est évalué pour la sélection. L'analyse s'en trouve ainsi accélérée.
- Les divisions sont définies en exécutant une analyse discriminante quadratique via l'entrée sélectionnée dans les groupes qui se composent des catégories cible. Là encore, cette méthode accélère le processus lors d'une recherche complète (C&RT) pour déterminer la division optimale.
Conditions requises. Les champs d'entrée peuvent être continus (intervalles numériques), mais les champs cible doivent être catégoriels. Toutes les divisions sont binaires. Il est impossible d'utiliser les champs de pondération. Les champs ordinaux (ensemble ordonné) utilisés dans le modèle doivent disposer d'un stockage numérique (et non d'une chaîne). Si nécessaire, vous pouvez utiliser le noeud Recoder pour les convertir.
Force. A l'instar de CHAID, mais contrairement à C&RT, QUEST a recours à des tests statistiques pour décider si un champ d'entrée doit éventuellement être utilisé. Cette méthode traite également à part les problèmes de sélection et de division d'entrées, en appliquant différents critères à chacun. QUEST contraste avec CHAID, méthode dans laquelle le résultat du test statistique déterminant la sélection de variables génère également la division. De même, l'arbre C&RT utilise la mesure d'incrément d'impureté pour sélectionner le champ d'entrée et définir la scission.