Il nodo Tree - AS è simile al nodo CHAID; tuttavia, il nodo Tree - AS è progettato per elaborare grandi quantità di dati per creare una singola struttura ad albero e visualizza il modello risultante nel visualizzatore di output. Il nodo genera una struttura ad albero delle decisioni utilizzando statistiche chi-quadrato (CHAID) per identificare le suddivisioni ottimali. Tale utilizzo di CHAID può generare strutture ad albero non binarie; ciò significa che alcune suddivisioni dispongono di più di due rami. I campi obiettivo e di input possono essere intervallo numerico (continui) o categoriali. Un CHAID completo è una modificazione di CHAID che esegue operazioni avanzate per l'analisi di tutte le suddivisioni possibili, ma richiede tempi di elaborazione maggiori.
Proprietà treeas |
Valori | Descrizione proprietà |
---|---|---|
target |
campo | Nel nodo Tree-AS, i modelli CHAID richiedono un solo campo obiettivo e uno o più campi di input. È inoltre possibile specificare un campo frequenza. Per ulteriori informazioni, consultare Proprietà comuni del nodo Modelli . |
method |
chaid exhaustive_chaid |
|
max_depth |
intero | Profondità massima della struttura ad albero, da 0 a 20. Il valore predefinito è 5. |
num_bins |
intero | Utilizzata solo se i dati sono costituiti da input continui. Impostare il numero di bin di frequenza da utilizzare per gli input; le opzioni sono: 2, 4, 5, 10, 20, 25, 50 o 100. |
record_threshold |
intero | Il numero di record a cui il modello passerà dall'utilizzo dei valori P all'utilizzo delle dimensioni degli effetti durante la creazione della struttura ad albero. Il valore predefinito è 1.000.000; aumentare o diminuire questo valore con incrementi di 10.000. |
split_alpha |
numero | Livello di significatività per suddivisione. Il valore deve essere compreso tra 0,01 e 0,99. |
merge_alpha |
numero | Livello di significatività per unione. Il valore deve essere compreso tra 0,01 e 0,99. |
bonferroni_adjustment |
indicatore | Adegua valori di significatività tramite il metodo di Bonferroni. |
effect_size_threshold_cont |
numero | Impostare la soglia della dimensione degli effetti durante la suddivisione dei nodi e l'unione delle categorie quando si utilizza un obiettivo continuo. Il valore deve essere compreso tra 0,01 e 0,99. |
effect_size_threshold_cat |
numero | Impostare la soglia della dimensione degli effetti durante la suddivisione dei nodi e l'unione delle categorie quando si utilizza un obiettivo categoriale. Il valore deve essere compreso tra 0,01 e 0,99. |
split_merged_categories |
indicatore | Consenti risuddivisione di categorie unite. |
grouping_sig_level |
numero | Utilizzato per determinare il modo in cui i gruppi di nodi sono costituiti o come vengono identificati i nodi inusuali. |
chi_square |
pearson likelihood_ratio |
Metodo utilizzato per calcolare la statistica chi-quadrato: Pearson o Rapporto di verosimiglianza |
minimum_record_use |
use_percentage use_absolute |
|
min_parent_records_pc |
numero | Il valore predefinito è 2. Valore minimo 1, massimo 100, con incrementi di 1. Il valore del ramo parent deve essere maggiore del ramo child. |
min_child_records_pc |
numero | Il valore predefinito è 1. Valore minimo 1, massimo 100, con incrementi di 1. |
min_parent_records_abs |
numero | Il valore predefinito è 100. Valore minimo 1, massimo 100, con incrementi di 1. Il valore del ramo parent deve essere maggiore del ramo child. |
min_child_records_abs |
numero | Il valore predefinito è 50. Valore minimo 1, massimo 100, con incrementi di 1. |
epsilon |
numero | Modifica minima nelle frequenze di cella previste. |
max_iterations |
numero | Numero massimo di iterazioni per la convergenza. |
use_costs |
indicatore | |
costs |
strutturato | Proprietà strutturata. Il formato è un elenco di 3 valori: il valore
effettivo, il valore previsto ed il costo nel caso di previsione errata. Ad esempio: tree.setPropertyValue("costs", [["drugA", "drugB", 3.0], ["drugX", "drugY",
4.0]]) |
default_cost_increase |
none linear square custom |
abilitata solo per obiettivi ordinali. Impostare i valori predefiniti nelle matrice costi. |
calculate_conf |
indicatore | |
display_rule_id |
indicatore | Aggiunge un campo all'output del calcolo del punteggio che indica l'ID del nodo terminale al quale è assegnato ogni record. |