0 / 0
Retourner à la version anglaise de la documentation
propriétés de cartnode
Dernière mise à jour : 07 oct. 2024
propriétés de cartnode

Icône du noeud Arbre C & RTLe noeud Arbre Classification et Regression (C&RT) génère un arbre de décisions qui vous permet de prévoir ou de classifier les observations futures. La méthode utilise la technique de partition récursive afin de diviser les données d'apprentissage en segments en réduisant l'index d'impureté à chaque étape, un noeud de l'arbre étant considéré comme "pur" si 100 % de ses observations appartiennent à une catégorie spécifique du champ cible. Les champs cible et les champs d'entrée peuvent être des champs d'intervalle numériques ou des champs catégoriels numériques (nominal,ordinal ou indicateur). Toutes les divisions sont binaires (deux sous-groupes uniquement).

Exemple

node = stream.createAt("cart", "My node", 200, 100)
# "Fields" tab
node.setPropertyValue("custom_fields", True)
node.setPropertyValue("target", "Drug")
node.setPropertyValue("inputs", ["Age", "BP", "Cholesterol"])
# "Build Options" tab, "Objective" panel
node.setPropertyValue("model_output_type", "InteractiveBuilder")
node.setPropertyValue("use_tree_directives", True)
node.setPropertyValue("tree_directives", """Grow Node Index 0 Children 1 2
Grow Node Index 2 Children 3 4""")
# "Build Options" tab, "Basics" panel
node.setPropertyValue("prune_tree", False)
node.setPropertyValue("use_std_err_rule", True)
node.setPropertyValue("std_err_multiplier", 3.0)
node.setPropertyValue("max_surrogates", 7)
# "Build Options" tab, "Stopping Rules" panel
node.setPropertyValue("use_percentage", True)
node.setPropertyValue("min_parent_records_pc", 5)
node.setPropertyValue("min_child_records_pc", 3)
# "Build Options" tab, "Advanced" panel
node.setPropertyValue("min_impurity", 0.0003)
node.setPropertyValue("impurity_measure", "Twoing")
# "Model Options" tab
node.setPropertyValue("use_model_name", True)
node.setPropertyValue("model_name", "Cart_Drug")
Tableau 1. propriétés de cartnode
Propriétés cartnode Valeurs Description de la propriété
target Zone Les modèles d'arbre C&R requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir la rubrique Propriétés de noeud de modélisation communes .
continue_training_existing_model option  
objective Standard Boosting Bagging psm psm est utilisé pour les ensembles de données très volumineux et nécessite une connexion au serveur.
model_output_type Single InteractiveBuilder  
use_tree_directives option  
tree_directives chaîne Définissez les directives de développement de l'arbre. Vous pouvez placer les directives entre guillemets triples pour ne pas tenir compte des caractères d'insertion de ligne ou des guillemets doubles. Notez que les directives sont parfois très sensibles aux modifications, même mineures, apportées aux données ou aux options de modélisation. Elles peuvent ne pas s'étendre aux autres jeux de données.
use_max_depth Default Custom  
max_depth Integer Profondeur maximale de l'arbre, de 0 à 1000. Utilisé uniquement si use_max_depth = Custom.
prune_tree option Elagage de l'arbre pour éviter le surajustement.
use_std_err option Utiliser la différence maximale pour le risque (dans Erreurs standard).
std_err_multiplier number Différence maximale.
max_surrogates number Nombre maximal de substitutions.
use_percentage option  
min_parent_records_pc number  
min_child_records_pc number  
min_parent_records_abs number  
min_child_records_abs number  
use_costs option  
costs structuré Propriétés structurées.
priors Data Equal Custom  
custom_priors structuré Propriétés structurées.
adjust_priors option  
trails number Nombre des modèles de composant pour le boosting ou le bagging.
set_ensemble_method Voting HighestProbability HighestMeanProbability Règles de combinaison par défaut pour les cibles catégorielles.
range_ensemble_method Mean Median Règles de combinaison par défaut pour les cibles continues.
large_boost option Appliquer le boosting aux jeux de données très volumineux.
min_impurity number  
impurity_measure Gini Twoing Ordered  
train_pct number Ensemble de prévention de surajustement.
set_random_seed option Dupliquer l'option des résultats.
seed number  
calculate_variable_importance option  
calculate_raw_propensities option  
calculate_adjusted_propensities option  
adjusted_propensity_partition Test Validation