Retourner à la version anglaise de la documentationpropriétés xgboostasnode
propriétés xgboostasnode
Dernière mise à jour : 07 oct. 2024
XGBoost est une implémentation avancée d'un algorithme de boosting de gradient. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. XGBoost est très flexible et propose de nombreux paramètres qui peuvent s'avérer encombrants pour la plupart des utilisateurs, et c'est pourquoie le noeud XGBoost-AS de SPSS Modeler expose les fonctions de base et les paramètres couramment utilisés. Le noeud XGBoost-AS est implémenté dans Spark.
xgboostasnode propriétés |
Type de données | Description de la propriété |
---|---|---|
target_field |
Zone | Liste des noms de champ pour la cible. |
input_fields |
Zone | Liste des noms de champ pour les entrées. |
nWorkers |
Integer | Nombre d'agents utilisés pour former le modèle XGBoost. La valeur par défaut est 1 . |
numThreadPerTask |
Integer | Nombre d'unités d'exécution utilisées par agent. La valeur par défaut est 1 . |
useExternalMemory |
Booléen | Indique si la mémoire externe être utilisée comme cache. La valeur par défaut est false. |
boosterType |
chaîne | Type de booster à utiliser. Les options disponibles sont gbtree , gblinear , ou dart . La valeur par défaut est gbtree . |
numBoostRound |
Integer | Nombre des itérations de boosting. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 10 . |
scalePosWeight |
Double | Permet de contrôler l'équilibre des pondérations positives et négatives. La valeur par défaut est 1 . |
randomseed |
Integer | Valeur de départ utilisée par le générateur de nombres aléatoires. La valeur par défaut est 0. |
objectiveType |
chaîne | Objectif d'apprentissage. Les valeurs possibles sont reg:linear , reg:logistic , reg:gamma , reg:tweedie ,rank:pairwise , binary:logistic ou multi . Notez que pour les cibles de marqueur, seules binary:logistic ou multi peuvent être utilisées. Si multi est utilisé, le résultat du score affiche les types d'objectif XGBoost multi:softmax et multi:softprob . La valeur par défaut est reg:linear . |
evalMetric |
chaîne | Métriques d'évaluation des données de validation. Une métrique par défaut est affectée en fonction de l'objectif. Les valeurs possibles sont rmse , mae , logloss , error , merror , mlogloss , auc , ndcg , map ou gamma-deviance . La valeur par défaut est rmse . |
lambda |
Double | Terme de régularisation de niveau 2 sur les pondérations. L'augmentation de cette valeur rend le modèle plus conservateur. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 1 . |
alpha |
Double | Terme de régularisation de niveau 1 sur les pondérations. L'augmentation de cette valeur rend le modèle plus conservateur. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0 . |
lambdaBias |
Double | Terme de régularisation de niveau 2 sur le biais. Si le type de renforcement gblinear est utilisé, ce paramètre de renforcement linéaire sur biais lambda est disponible. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 0 . |
treeMethod |
chaîne | Si le type de renforcement gbtree ou dart est utilisé, ce paramètre de la méthode de déploiement des arbres (et les autres paramètre d'arborescence qui suivent) est disponible. Il indique l'algorithme de construction d'arbre XGBoost à utiliser. Les options disponibles sont auto , exact ou approx . La valeur par défaut est auto . |
maxDepth |
Integer | Profondeur maximale des arbres. Spécifiez une valeur de 2 ou une valeur supérieure. La valeur par défaut est 6 . |
minChildWeight |
Double | Somme minimale des pondérations d'instance (de Hess) nécessaire dans un enfant. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 1 . |
maxDeltaStep |
Double | Etape delta maximale à autoriser pour l'estimation de la pondération de chaque arbre. Spécifiez une valeur de 0 ou une valeur supérieure. La valeur par défaut est 0 . |
sampleSize |
Double | Le sous-échantillon est le rapport de l'instance d'apprentissage. Indiquez une valeur entre 0.1 et 1.0 . La valeur par défaut est 1.0 . |
eta |
Double | Réduction de la taille d'étape utilisée lors de l'étape de mise à jour afin d'éviter le surajustement. Indiquez une valeur entre 0 et 1 . La valeur par défaut est 0.3 . |
gamma |
Double | Réduction des pertes minimale requise pour créer une autre partition sur un noeud terminal de l'arbre. Indiquez un nombre 0 ou supérieur. La valeur par défaut est 6 . |
colsSampleRatio |
Double | Rapport du sous-échantillon de colonnes lors de la construction de chaque arbre. Indiquez une valeur entre 0.01 et 1 . La valeur par défaut est1 . |
colsSampleLevel |
Double | Rapport du sous-échantillon de colonnes pour chaque scission par niveau. Indiquez une valeur entre 0.01 et 1 . La valeur par défaut est 1 . |
normalizeType |
chaîne | Si le type de booster dart est utilisé, ce paramètre dart et les trois paramètres dart sont disponibles. Ce paramètre définit l'algorithme de normalisation. Spécifiez tree ou forest . La valeur par défaut est tree . |
sampleType |
chaîne | Type d'algorithme d'échantillonnage. Spécifiez uniform ou weighted . La valeur par défaut est uniform . |
rateDrop |
Double | Paramètre de booster dart pour le taux d'abandon. Indiquez une valeur entre 0.0 et 1.0 . La valeur par défaut est 0.0 . |
skipDrop |
Double | Paramètre du booster dart pour la probabilité d'abandon. Indiquez une valeur entre 0.0 et 1.0 . La valeur par défaut est 0.0 . |