Volver a la versión inglesa de la documentaciónpropiedades de treeas
propiedades de treeas
Última actualización: 07 oct 2024
El nodo Tree-AS es similar al nodo CHAID; sin embargo, el nodo Tree-AS está diseñado para procesar big data para crear un único árbol y muestra el modelo resultante en el visor de resultados. El nodo genera un árbol de decisiones utilizando estadísticas de chi-cuadrado (CHAID) para identificar divisiones opcionales. Este uso de CHAID puede generar árboles no binarios, lo que significa que algunas divisiones generarán más de dos ramas. Los campos de entrada y objetivo pueden ser continuos (rango numérico) o categóricos. CHAID exhaustivo es una modificación de CHAID que examina con mayor precisión todas las divisiones posibles, aunque necesita más tiempo para realizar los cálculos.
Propiedades de treeas |
Valores | Descripción de la propiedad |
---|---|---|
target |
campo | En el nodo Tree-AS, los modelos CHAID requieren un único objetivo y uno o más campos de entrada. También se puede especificar un campo de frecuencia. Consulte Propiedades comunes del nodo de modelado para obtener más información. |
method |
chaid exhaustive_chaid |
|
max_depth |
entero | Profundidad máxima del árbol, de 0 a 20. El valor predeterminado es 5. |
num_bins |
entero | Sólo se utiliza si los datos están formados por entradas continuas. Establezca el número de intervalos de frecuencia que deben utilizarse para las entradas; las opciones son 2, 4, 5, 10, 20, 25, 50 o 100. |
record_threshold |
entero | El número de registros en los que el modelo pasa de usar valores p a tamaños del efecto mientras se construye el árbol. El valor predeterminado es de 1.000.000; se incrementa o decrementa de 10.000 en 10.000. |
split_alpha |
número | Nivel de significancia para división. El valor debe estar entre 0,01 y 0,99. |
merge_alpha |
número | Nivel de significancia para fusión. El valor debe estar entre 0,01 y 0,99. |
bonferroni_adjustment |
distintivo | Los valores de significancia de ajuste utilizando el método de Bonferroni. |
effect_size_threshold_cont |
número | Establece el umbral del tamaño del efecto cuando se dividen los nodos y fusionan las categorías al usar un objetivo continuo. El valor debe estar entre 0,01 y 0,99. |
effect_size_threshold_cat |
número | Establezca el umbral de tamaño de efecto al dividir nodos y fusionar categorías al utilizar un objetivo categórico. El valor debe estar entre 0,01 y 0,99. |
split_merged_categories |
distintivo | Permitir segunda división de categorías fusionadas. |
grouping_sig_level |
número | Se usa para determinar cómo se forman los grupos de nodos o cómo se identifican los nodos inusuales. |
chi_square |
pearson likelihood_ratio |
Método usado para calcular la estadística de chi cuadrado: Pearson o Razón de verosimilitud |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
número | El valor predeterminado es 2. Mínimo 1, máximo 100, e incrementos de 1. El valor de la rama padre debe ser mayor que la rama hijo. |
min_child_records_pc |
número | El valor predeterminado es 1. Mínimo 1, máximo 100, e incrementos de 1. |
min_parent_records_abs |
número | El valor por omisión es 100. Mínimo 1, máximo 100, e incrementos de 1. El valor de la rama padre debe ser mayor que la rama hijo. |
min_child_records_abs |
número | El valor predeterminado es 50. Mínimo 1, máximo 100, e incrementos de 1. |
epsilon |
número | Cambio mínimo en frecuencias de casillas esperadas. |
max_iterations |
número | Número máximo de iteraciones para la convergencia. |
use_costs |
distintivo | |
costs |
estructurado | Propiedad estructurada. El formato es una lista de 3 valores: el valor real, el valor predicho y el coste si dicha predicción es errónea. Por ejemplo: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
Sólo se habilita para objetivos ordinales. Establezca valores predeterminados en la matriz de costes. |
calculate_conf |
distintivo | |
display_rule_id |
distintivo | Añade un campo en el resultado de puntuación que indica el ID para el nodo terminal al que se asigna cada registro. |