Retourner à la version anglaise de la documentationpropriétés de cartnode
propriétés de cartnode
Dernière mise à jour : 07 oct. 2024
Le noeud Arbre Classification et Regression (C&RT) génère un arbre de décisions qui vous permet de prévoir ou de classifier les observations futures. La méthode utilise la technique de partition récursive afin de diviser les données d'apprentissage en segments en réduisant l'index d'impureté à chaque étape, un noeud de l'arbre étant considéré comme "pur" si 100 % de ses observations appartiennent à une catégorie spécifique du champ cible. Les champs cible et les champs d'entrée peuvent être des champs d'intervalle numériques ou des champs catégoriels numériques (nominal,ordinal ou indicateur). Toutes les divisions sont binaires (deux sous-groupes uniquement).
Exemple
node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
Propriétés cartnode |
Valeurs | Description de la propriété |
---|---|---|
target |
Zone | Les modèles d'arbre C&R requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir la rubrique Propriétés de noeud de modélisation communes . |
continue_training_existing_model |
option | |
objective |
Standard Boosting Bagging psm |
psm est utilisé pour les ensembles de données très volumineux et nécessite une connexion au serveur. |
model_output_type |
Single InteractiveBuilder |
|
use_tree_directives |
option | |
tree_directives |
chaîne | Définissez les directives de développement de l'arbre. Vous pouvez placer les directives entre guillemets triples pour ne pas tenir compte des caractères d'insertion de ligne ou des guillemets doubles. Notez que les directives sont parfois très sensibles aux modifications, même mineures, apportées aux données ou aux options de modélisation. Elles peuvent ne pas s'étendre aux autres jeux de données. |
use_max_depth |
Default Custom |
|
max_depth |
Integer | Profondeur maximale de l'arbre, de 0 à 1000. Utilisé uniquement si use_max_depth
= Custom . |
prune_tree |
option | Elagage de l'arbre pour éviter le surajustement. |
use_std_err |
option | Utiliser la différence maximale pour le risque (dans Erreurs standard). |
std_err_multiplier |
number | Différence maximale. |
max_surrogates |
number | Nombre maximal de substitutions. |
use_percentage |
option | |
min_parent_records_pc |
number | |
min_child_records_pc |
number | |
min_parent_records_abs |
number | |
min_child_records_abs |
number | |
use_costs |
option | |
costs |
structuré | Propriétés structurées. |
priors |
Data Equal Custom |
|
custom_priors |
structuré | Propriétés structurées. |
adjust_priors |
option | |
trails |
number | Nombre des modèles de composant pour le boosting ou le bagging. |
set_ensemble_method |
Voting HighestProbability HighestMeanProbability |
Règles de combinaison par défaut pour les cibles catégorielles. |
range_ensemble_method |
Mean Median |
Règles de combinaison par défaut pour les cibles continues. |
large_boost |
option | Appliquer le boosting aux jeux de données très volumineux. |
min_impurity |
number | |
impurity_measure |
Gini Twoing Ordered |
|
train_pct |
number | Ensemble de prévention de surajustement. |
set_random_seed |
option | Dupliquer l'option des résultats. |
seed |
number | |
calculate_variable_importance |
option | |
calculate_raw_propensities |
option | |
calculate_adjusted_propensities |
option | |
adjusted_propensity_partition |
Test Validation |