Retourner à la version anglaise de la documentationpropriétés xgboosttreenode
propriétés xgboosttreenode
Dernière mise à jour : 07 oct. 2024
XGBoost Tree est une implémentation avancée d'un algorithme de boosting de gradient qui utilise un modèle d'arbre comme modèle de base. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. L'arborescence XGBoost est très flexible et fournit de nombreux paramètres qui peuvent être accablants pour la plupart des utilisateurs, de sorte que le noeud XGBoost dans SPSS Modeler expose les fonctions de base et les paramètres couramment utilisés. Ce noeud est mis en oeuvre dans Python.
xgboosttreenode propriétés |
Type de données | Description de la propriété |
---|---|---|
custom_fields |
Booléen | Cette option indique au noeud d'utiliser les informations du champ spécifiées ici au lieu des informations données dans un noeud type en amont. Après avoir sélectionné cette option, spécifiez les zones requises. |
target |
Zone | Champs cible. |
inputs |
Zone | Champs d'entrée. |
tree_method |
chaîne | Méthode d'arbre pour la génération de modèle. Les valeurs possibles sont : auto , exact ou approx . La valeur par défaut est auto . |
num_boost_round |
Integer | Valeur du nombre d'itérations de boosting pour la génération de modèle. Indiquez une valeur entre 1 et 1000 . La valeur par défaut est 10 . |
max_depth |
Integer | Nombre de niveaux maximal pour la croissance d'arbre. Spécifiez une valeur de 1 ou une valeur supérieure. La valeur par défaut est 6 . |
min_child_weight |
Double | Pondération d'enfant minimale pour la croissance d'arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 1 . |
max_delta_step |
Double | Etape delta maximale pour la croissance d'arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 0 . |
objective_type |
chaîne | Type d'objectif de la tâche d'apprentissage. Les valeurs possibles sontreg:linear , reg:logistic , reg:gamma , reg:tweedie ,count:poisson ,rank:pairwise , binary:logistic ou multi . Notez que pour les cibles d'indicateur, seules binary:logistic ou multi peuvent être utilisées. Si multi est utilisé, le résultat du score affiche les types objectifs multi:softmax et multi:softprob XGBoost. |
early_stopping |
Booléen | Indique si la fonction d'arrêt précoce doit être utilisée. La valeur par défaut est False . |
early_stopping_rounds |
Integer | Les erreurs de validation doivent diminuer au moins à chaque nombre d'arrêts précoces pour poursuivre
l'apprentissage. La valeur par défaut est 10 . |
evaluation_data_ratio |
Double | Ratio des données d'entrée utilisé pour les erreurs de validation. La valeur par défaut est 0.3 . |
random_seed |
Integer | Valeur de départ aléatoire. N'importe quel nombre entre 0 et 9999999 . La valeur par défaut est 0 . |
sample_size |
Double | Sous-échantillon pour le contrôle du surajustement. Indiquez une valeur entre 0.1 et 1.0 . La valeur par défaut est 0.1 . |
eta |
Double | Eta pour le contrôle du surajustement. Indiquez une valeur entre 0 et 1 . La valeur par défaut est 0.3 . |
gamma |
Double | Gamma pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 6 . |
col_sample_ratio |
Double | Colsample par arbre pour le contrôle du surajustement. Indiquez une valeur entre 0.01 et 1 . La valeur par défaut est 1 . |
col_sample_level |
Double | Colsample par niveau pour le contrôle du surajustement. Indiquez une valeur entre 0.01 et 1 . La valeur par défaut est 1 . |
lambda |
Double | Lambda pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 1 . |
alpha |
Double | Alpha pour le contrôle du surajustement. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0 . |
scale_pos_weight |
Double | Mise à l'échelle des pondérations pour le traitement des jeux de données déséquilibrés. La valeur par défaut est 1 . |
use_HPO |