Le noeud Arbre Classification et Regression (C&RT) génère un arbre de décisions qui vous permet de prévoir ou de classifier les observations futures. La méthode utilise la technique de partition récursive afin de diviser les données d'apprentissage en segments en réduisant l'index d'impureté à chaque étape, un noeud de l'arbre étant considéré comme "pur" si 100 % de ses observations appartiennent à une catégorie spécifique du champ cible. Les champs cible et les champs d'entrée peuvent être des champs d'intervalle numériques ou des champs catégoriels numériques (nominal,ordinal ou indicateur). Toutes les divisions sont binaires (deux sous-groupes uniquement).
Copy to clipboardCopié dans le presse-papiersShow more
Tableau 1. propriétés de cartnode
Propriétés cartnode
Valeurs
Description de la propriété
target
Zone
Les modèles d'arbre C&R requièrent un seul champ cible et un ou plusieurs champs d'entrée. Un champ de fréquence peut aussi être spécifié. Pour plus d'informations, voir la rubrique Propriétés de noeud de modélisation communes .
continue_training_existing_model
option
objective
StandardBoostingBaggingpsm
psm est utilisé pour les ensembles de données très volumineux et nécessite une connexion au serveur.
model_output_type
SingleInteractiveBuilder
use_tree_directives
option
tree_directives
chaîne
Définissez les directives de développement de l'arbre. Vous pouvez placer les directives entre guillemets triples pour ne pas tenir compte des caractères d'insertion de ligne ou des guillemets doubles. Notez que les directives sont parfois très sensibles aux modifications, même mineures, apportées aux données ou aux options de modélisation. Elles peuvent ne pas s'étendre aux autres jeux de données.
use_max_depth
DefaultCustom
max_depth
Integer
Profondeur maximale de l'arbre, de 0 à 1000. Utilisé uniquement si use_max_depth
= Custom.
prune_tree
option
Elagage de l'arbre pour éviter le surajustement.
use_std_err
option
Utiliser la différence maximale pour le risque (dans Erreurs standard).
std_err_multiplier
number
Différence maximale.
max_surrogates
number
Nombre maximal de substitutions.
use_percentage
option
min_parent_records_pc
number
min_child_records_pc
number
min_parent_records_abs
number
min_child_records_abs
number
use_costs
option
costs
structuré
Propriétés structurées.
priors
Data Equal Custom
custom_priors
structuré
Propriétés structurées.
adjust_priors
option
trails
number
Nombre des modèles de composant pour le boosting ou le bagging.
set_ensemble_method
VotingHighestProbabilityHighestMeanProbability
Règles de combinaison par défaut pour les cibles catégorielles.
range_ensemble_method
MeanMedian
Règles de combinaison par défaut pour les cibles continues.
large_boost
option
Appliquer le boosting aux jeux de données très volumineux.