QUEST, o árbol estadístico eficiente insesgado y rápido, es un método de clasificación binario para generar árboles de decisión. Una de las principales motivaciones para su desarrollo ha sido la reducción del tiempo de procesamiento necesario para los análisis de C&RT de gran tamaño con varias variables o varios casos. Un segundo objetivo de QUEST consiste en reducir la tendencia de los métodos de clasificación de árboles para favorecer a las entradas que permiten realizar más divisiones, es decir, los campos de entrada continuos (rango numérico) o los correspondientes a varias categorías.
- QUEST utiliza una secuencia de reglas basada en comprobaciones de significación para evaluar los campos de entrada de un nodo. A efectos de selección, únicamente deberá realizar una sola comprobación en las distintas entradas de un nodo. A diferencia de lo que ocurre con C&RT, no se examinan todas las divisiones y, a diferencia de los casos de C&RT y CHAID, las combinaciones de categorías no se comprueban al evaluar un campo de entrada para su selección. Así se aumenta la velocidad del análisis.
- Para determinar las divisiones, se ejecuta un análisis de discriminante cuadrático mediante la entrada seleccionada en los grupos formados por las categorías objetivo. Este método vuelve a mejorar la velocidad de las búsquedas exhaustivas (C&RT) para determinar la división óptima.
Requisitos. Los campos de entrada pueden ser continuos (rango numérico), sin embargo el campo objetivo debe ser categórico. Todas las divisiones son binarias. No podrá utilizar los campos de ponderación. Todos los campos ordinales (conjunto ordenado) utilizados en el modelo deben disponer de almacenamiento numérico (no en cadenas). Si lo considera necesario, utilice a continuación el nodo Reclasificar para realizar las conversiones.
Puntos fuertes. Al igual que CHAID (pero a diferencia de C&RT), QUEST utiliza comprobaciones estadísticas para decidir si se ha de utilizar un campo de entrada o no. También separa las cuestiones relacionadas con la división y la selección de entradas, y aplica criterios distintos a ambos casos. Esto contrasta con los casos de CHAID, donde el resultado de la comprobación de estadísticas que determina la selección de variables también genera la división. De un modo similar, C&RT emplea la medida de impureza-cambio tanto para seleccionar un campo de entrada como para determinar la división.