Volver a la versión inglesa de la documentaciónpropiedades de xgboostasnode
propiedades de xgboostasnode
Última actualización: 07 oct 2024
XGBoost es una implementación avanzada de un algoritmo de aumento de gradiente. Los algoritmos de aumento conocen de forma iterativa los clasificadores débiles y, a continuación, los añaden a un clasificador fuerte final. XGBoost es muy flexible y proporciona muchos parámetros que pueden ser abrumadores para la mayoría de los usuarios, por lo que el nodo XGBoost-AS en SPSS Modeler expone las características principales y los parámetros de uso común. El nodo XGBoost-AS se implementa en Spark.
Propiedades de xgboostasnode |
Tipo de datos | Descripción de la propiedad |
---|---|---|
target_field |
campo | Lista de los nombres de campo para el objetivo. |
input_fields |
campo | Lista de los nombres de campo para entradas. |
nWorkers |
entero | El número de trabajadores utilizados para formar el modelo XGBoost. El valor predeterminado es 1 . |
numThreadPerTask |
entero | El número de hebras utilizadas por trabajador. El valor predeterminado es 1 . |
useExternalMemory |
Boolean | Indica si se va a utilizar memoria externa como memoria caché. El valor predeterminado es false. |
boosterType |
serie | El tipo de amplificador para utilizar. Las opciones disponibles son gbtree , gblinear o dart . El valor predeterminado es gbtree . |
numBoostRound |
entero | El número de rondas para aumentar. Especifique un valor de 0 o superior. El valor predeterminado es 10 . |
scalePosWeight |
Double | Controle el equilibrio entre ponderaciones positivas y negativas. El valor predeterminado es 1 . |
randomseed |
entero | Semilla utilizada por el generador de números aleatorios. El valor predeterminado es 0. |
objectiveType |
serie | El objetivo de aprendizaje. Los valores posibles son reg:linear , reg:logistic , reg:gamma , reg:tweedie ,rank:pairwise , binary:logistic o multi . Tenga en cuenta que para los destinos de distintivo, sólo se puede utilizar binary:logistic o multi . Si se utiliza multi , el resultado de la puntuación mostrará los tipos de objetivos multi:softmax y multi:softprob XGBoost. El valor predeterminado es reg:linear . |
evalMetric |
serie | Las métricas de evaluación para datos de validación. Se asignará una métrica predeterminada de acuerdo con el objetivo. Los valores posibles son rmse , mae , logloss , error , merror , mlogloss , auc , ndcg , map o gamma-deviance . El valor predeterminado es rmse . |
lambda |
Double | Término de regularización L2 en ponderaciones. Al aumentar este valor, el modelo será más conservador. Especifique cualquier número 0 o superior. El valor predeterminado es 1 . |
alpha |
Double | Término de regularización L1 sobre ponderaciones. Al aumentar este valor, el modelo será más conservador. Especifique cualquier número 0 o superior. El valor predeterminado es 0 . |
lambdaBias |
Double | Término de regularización L2 en sesgo. Si se utiliza el tipo de refuerzo gblinear , este parámetro de refuerzo lineal de sesgo lambda está disponible. Especifique cualquier número 0 o superior. El valor predeterminado es 0 . |
treeMethod |
serie | Si se utiliza el tipo de refuerzo gbtree o dart , este parámetro de método de árbol para el crecimiento de árbol (y los demás parámetros de árbol que siguen) está disponible. Especifica el algoritmo de construcción de árbol XGBoost para utilizar. Las opciones disponibles son auto , exact o approx . El valor predeterminado es auto . |
maxDepth |
entero | La profundidad máxima para árboles. Especifique un valor de 2 o superior. El valor predeterminado es 6 . |
minChildWeight |
Double | La suma mínima de la ponderación de instancias (hessiana) necesaria en un hijo. Especifique un valor de 0 o superior. El valor predeterminado es 1 . |
maxDeltaStep |
Double | El paso delta máximo para permitir para la estimación ponderada de cada árbol. Especifique un valor de 0 o superior. El valor predeterminado es 0 . |
sampleSize |
Double | La muestra secundaria es la proporción de la instancia de formación. Especifique un valor entre 0.1 y 1.0 . El valor predeterminado es 1.0 . |
eta |
Double | La reducción de tamaño de paso utilizada durante el paso para evitar el sobreajuste. Especifique un valor entre 0 y 1 . El valor predeterminado es 0.3 . |
gamma |
Double | La reducción de pérdida mínima necesaria para realizar una partición adicional en un nodo hoja del árbol. Especifique cualquier número 0 o superior. El valor predeterminado es 6 . |
colsSampleRatio |
Double | La proporción de muestra secundaria de columnas al construir cada árbol. Especifique un valor entre 0.01 y 1 . El valor predeterminado es 1 . |
colsSampleLevel |
Double | La proporción de muestra secundaria de columnas para cada división, en cada nivel. Especifique un valor entre 0.01 y 1 . El valor predeterminado es 1 . |
normalizeType |
serie | Si se utiliza el tipo de amplificador dart, están disponibles este parámetro dart y los tres parámetros dart siguientes. Este parámetro define el algoritmo de normalización. Especifique tree o forest . El valor predeterminado es tree . |
sampleType |
serie | El tipo de algoritmo de muestreo. Especifique uniform o weighted . El valor predeterminado es uniform . |
rateDrop |
Double | El parámetro de amplificador dart de índice de descarte. Especifique un valor entre 0.0 y 1.0 . El valor predeterminado es 0.0 . |
skipDrop |
Double | El parámetro de amplificador dart para la probabilidad de descarte de salto. Especifique un valor entre 0.0 y 1.0 . El valor predeterminado es 0.0 . |