0 / 0
Retourner à la version anglaise de la documentation
propriétés xgboostasnode
Dernière mise à jour : 07 oct. 2024
propriétés xgboostasnode

Icône de noeud XGBoost-ASXGBoost est une implémentation avancée d'un algorithme de boosting de gradient. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. XGBoost est très flexible et propose de nombreux paramètres qui peuvent s'avérer encombrants pour la plupart des utilisateurs, et c'est pourquoie le noeud XGBoost-AS de SPSS Modeler expose les fonctions de base et les paramètres couramment utilisés. Le noeud XGBoost-AS est implémenté dans Spark.

Tableau 1. Propriétés de xgboostasnode
xgboostasnodepropriétés Type de données Description de la propriété
target_field Zone Liste des noms de champ pour la cible.
input_fields Zone Liste des noms de champ pour les entrées.
nWorkers Integer Nombre d'agents utilisés pour former le modèle XGBoost. La valeur par défaut est 1.
numThreadPerTask Integer Nombre d'unités d'exécution utilisées par agent. La valeur par défaut est 1.
useExternalMemory Booléen Indique si la mémoire externe être utilisée comme cache. La valeur par défaut est false.
boosterType chaîne Type de booster à utiliser. Les options disponibles sont gbtree, gblinear, ou dart. La valeur par défaut est gbtree.
numBoostRound Integer Nombre des itérations de boosting. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 10.
scalePosWeight Double Permet de contrôler l'équilibre des pondérations positives et négatives. La valeur par défaut est 1.
randomseed Integer Valeur de départ utilisée par le générateur de nombres aléatoires. La valeur par défaut est 0.
objectiveType chaîne Objectif d'apprentissage. Les valeurs possibles sont reg:linear, reg:logistic, reg:gamma, reg:tweedie,rank:pairwise, binary:logistic ou multi. Notez que pour les cibles de marqueur, seules binary:logistic ou multi peuvent être utilisées. Si multi est utilisé, le résultat du score affiche les types d'objectif XGBoost multi:softmax et multi:softprob. La valeur par défaut est reg:linear.
evalMetric chaîne Métriques d'évaluation des données de validation. Une métrique par défaut est affectée en fonction de l'objectif. Les valeurs possibles sont rmse, mae, logloss, error, merror, mlogloss, auc, ndcg, mapou gamma-deviance. La valeur par défaut est rmse.
lambda Double Terme de régularisation de niveau 2 sur les pondérations. L'augmentation de cette valeur rend le modèle plus conservateur. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 1.
alpha Double Terme de régularisation de niveau 1 sur les pondérations. L'augmentation de cette valeur rend le modèle plus conservateur. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0.
lambdaBias Double Terme de régularisation de niveau 2 sur le biais. Si le type de renforcement gblinear est utilisé, ce paramètre de renforcement linéaire sur biais lambda est disponible. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0.
treeMethod chaîne Si le type de renforcement gbtree ou dart est utilisé, ce paramètre de la méthode de déploiement des arbres (et les autres paramètre d'arborescence qui suivent) est disponible. Il indique l'algorithme de construction d'arbre XGBoost à utiliser. Les options disponibles sont auto, exactou approx. La valeur par défaut est auto.
maxDepth Integer Profondeur maximale des arbres. Spécifiez une valeur de 2 ou une valeur supérieure. La valeur par défaut est 6.
minChildWeight Double Somme minimale des pondérations d'instance (de Hess) nécessaire dans un enfant. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 1.
maxDeltaStep Double Etape delta maximale à autoriser pour l'estimation de la pondération de chaque arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 0.
sampleSize Double Le sous-échantillon est le rapport de l'instance d'apprentissage. Indiquez une valeur entre 0.1 et 1.0. La valeur par défaut est 1.0.
eta Double Réduction de la taille d'étape utilisée lors de l'étape de mise à jour afin d'éviter le surajustement. Indiquez une valeur entre 0 et 1. La valeur par défaut est 0.3.
gamma Double Réduction des pertes minimale requise pour créer une autre partition sur un noeud terminal de l'arbre. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 6.
colsSampleRatio Double Rapport du sous-échantillon de colonnes lors de la construction de chaque arbre. Indiquez une valeur entre 0.01 et 1. La valeur par défaut est1.
colsSampleLevel Double Rapport du sous-échantillon de colonnes pour chaque scission par niveau. Indiquez une valeur entre 0.01 et 1. La valeur par défaut est 1.
normalizeType chaîne Si le type de booster dart est utilisé, ce paramètre dart et les trois paramètres dart sont disponibles. Ce paramètre définit l'algorithme de normalisation. Spécifiez tree ou forest. La valeur par défaut est tree.
sampleType chaîne Type d'algorithme d'échantillonnage. Spécifiez uniform ou weighted. La valeur par défaut est uniform.
rateDrop Double Paramètre de booster dart pour le taux d'abandon. Indiquez une valeur entre 0.0 et 1.0. La valeur par défaut est 0.0.
skipDrop Double Paramètre du booster dart pour la probabilité d'abandon. Indiquez une valeur entre 0.0 et 1.0. La valeur par défaut est 0.0.
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus