Torna alla versione inglese della documentazioneproprietà cartnode
proprietà cartnode
Ultimo aggiornamento: 07 ott 2024
Il nodo Struttura ad albero di classificazione e regressione (C&R) genera una struttura ad albero delle decisioni che consente di prevedere o classificare osservazioni future. Il metodo utilizza il partizionamento ricorsivo per suddividere i record di addestramento in segmenti riducendo al minimo l'impurità ad ogni fase, in cui un nodo nella struttura ad albero viene considerato "puro" se il 100% dei casi nel nodo rientra in una categoria specifica del campo di destinazione. I campi obiettivo e di input possono essere intervalli numerici o categoriali (nominali, ordinali o flag); tutte le suddivisioni sono binarie (solo due sottogruppi).
Esempio
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
Proprietà cartnode |
Valori | Descrizione proprietà |
---|---|---|
target |
campo | I modelli C&R Tree richiedono un solo campo obiettivo e uno o più campi di input. È inoltre possibile specificare un campo frequenza. Per ulteriori informazioni, consultare l'argomento Proprietà comuni dei nodi Modelli . |
continue_training_existing_model |
indicatore | |
objective |
Standard Boosting Bagging psm |
psm viene utilizzato per insiemi di dati di grandi dimensioni e richiede una connessione Server. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
indicatore | |
tree_directives |
Stringa | Specifica le direttive per l'ingrandimento di strutture ad albero. È possibile racchiudere le direttive tra virgolette triple per evitare il carattere escape in nuove righe o virgolette. Si noti che le direttive possono essere molto sensibili a piccole modifiche nelle opzioni di modellazione e nei dati e possono non essere generalizzate ad altri insiemi di dati. |
use_max_depth |
Default Custom |
|
max_depth |
intero | Profondità massima della struttura ad albero, da 0 a 1000. Utilizzato solo se use_max_depth
= Custom . |
prune_tree |
indicatore | Taglia struttura ad albero per evitare sovradattamento. |
use_std_err |
indicatore | Utilizza differenza massima di rischio (in errori standard). |
std_err_multiplier |
numero | Differenza massima. |
max_surrogates |
numero | Numero massimo surrogati. |
use_percentage |
indicatore | |
min_parent_records_pc |
numero | |
min_child_records_pc |
numero | |
min_parent_records_abs |
numero | |
min_child_records_abs |
numero | |
use_costs |
indicatore | |
costs |
strutturato | Proprietà strutturata. |
priors |
Data Equal Custom |
|
custom_priors |
strutturato | Proprietà strutturata. |
adjust_priors |
indicatore | |
trails |
numero | Numero di modelli di componenti per boosting o bagging. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
Regola di combinazione di default per obiettivi categoriali. |
range_ensemble_method |
Mean Median |
Regola di combinazione di default per target continui. |
large_boost |
indicatore | Applica il boosting a insiemi di dati di grandi dimensioni. |
min_impurity |
numero | |
impurity_measure |
Gini Twoing Ordered |
|
train_pct |
numero | Insieme di prevenzione del sovradattamento. |
set_random_seed |
indicatore | Opzione Replica risultati. |
seed |
numero | |
calculate_variable_importance |
indicatore | |
calculate_raw_propensities |
indicatore | |
calculate_adjusted_propensities |
indicatore | |
adjusted_propensity_partition |
Test Validation |