XGBoost Tree est une implémentation avancée d'un algorithme de boosting de gradient qui utilise un modèle d'arbre comme modèle de base. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. L'arborescence XGBoost est très flexible et fournit de nombreux paramètres qui peuvent être accablants pour la plupart des utilisateurs, de sorte que le noeud XGBoost dans SPSS Modeler expose les fonctions de base et les paramètres couramment utilisés. Le noeud est mis en oeuvre en Python.
Tableau 1. Propriétés de xgboosttreenode
xgboosttreenodepropriétés
Type de données
Description de la propriété
custom_fields
Booléen
Cette option indique au noeud d'utiliser les informations du champ spécifiées ici, au lieu de celles fournies par un ou des noeuds Type en amont. Après avoir sélectionné cette option, spécifiez les zones requises.
target
Zone
Champs cible.
inputs
Zone
Champs d'entrée.
tree_method
chaîne
Méthode d'arbre pour la génération de modèle. Les valeurs possibles sont : auto, exact ou approx. La valeur par défaut est auto.
num_boost_round
Integer
Valeur du nombre d'itérations de boosting pour la génération de modèle. Indiquez une valeur entre 1 et 1000. La valeur par défaut est 10.
max_depth
Integer
Nombre de niveaux maximal pour la croissance d'arbre. Spécifiez une valeur de 1 ou une valeur supérieure. La valeur par défaut est 6.
min_child_weight
Double
Pondération d'enfant minimale pour la croissance d'arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 1.
max_delta_step
Double
Etape delta maximale pour la croissance d'arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 0.
objective_type
chaîne
Type d'objectif de la tâche d'apprentissage. Les valeurs possibles sontreg:linear, reg:logistic, reg:gamma, reg:tweedie,count:poisson,rank:pairwise, binary:logisticou multi. Notez que pour les cibles d'indicateur, seules binary:logistic ou multi peuvent être utilisées. Si multi est utilisé, le résultat du score affiche les types objectifs multi:softmax et multi:softprob XGBoost.
early_stopping
Booléen
Indique si la fonction d'arrêt précoce doit être utilisée. La valeur par défaut est False.
early_stopping_rounds
Integer
Les erreurs de validation doivent diminuer au moins à chaque nombre d'arrêts précoces pour poursuivre
l'apprentissage. La valeur par défaut est 10.
evaluation_data_ratio
Double
Ratio des données d'entrée utilisé pour les erreurs de validation. La valeur par défaut est 0.3.
random_seed
Integer
Valeur de départ aléatoire. N'importe quel nombre entre 0 et 9999999. La valeur par défaut est 0.
sample_size
Double
Sous-échantillon pour le contrôle du surajustement. Indiquez une valeur entre 0.1 et 1.0. La valeur par défaut est 0.1.
eta
Double
Eta pour le contrôle du surajustement. Indiquez une valeur entre 0 et 1. La valeur par défaut est 0.3.
gamma
Double
Gamma pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 6.
col_sample_ratio
Double
Colsample par arbre pour le contrôle du surajustement. Indiquez une valeur entre 0.01 et 1. La valeur par défaut est 1.
col_sample_level
Double
Colsample par niveau pour le contrôle du surajustement. Indiquez une valeur entre 0.01 et 1. La valeur par défaut est 1.
lambda
Double
Lambda pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 1.
alpha
Double
Alpha pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0.
scale_pos_weight
Double
Mise à l'échelle des pondérations pour le traitement des jeux de données déséquilibrés. La valeur par défaut est 1.
À propos des cookies sur ce sitePour fonctionner correctement, nos sites Internet nécessitent certains cookies (requis). En outre, d'autres cookies peuvent être utilisés avec votre consentement pour analyser l'utilisation d'un site, améliorer l'expérience des utilisateurs et à des fins publicitaires.Pour plus informations, passez en revue vos options de préférences en préférences en matière de cookies. En visitant notre site Web, vous acceptez que nous traitions les informations comme décrit dans ladéclaration de confidentialité d’IBM.Pour faciliter la navigation, vos préférences en matière de cookie seront partagées dans les domaines Web d'IBM énumérés ici.