0 / 0
Volver a la versión inglesa de la documentación
propiedades de xgboostasnode
Última actualización: 07 oct 2024
propiedades de xgboostasnode

Icono de nodo XGBoost-ASXGBoost es una implementación avanzada de un algoritmo de aumento de gradiente. Los algoritmos de aumento conocen de forma iterativa los clasificadores débiles y, a continuación, los añaden a un clasificador fuerte final. XGBoost es muy flexible y proporciona muchos parámetros que pueden ser abrumadores para la mayoría de los usuarios, por lo que el nodo XGBoost-AS en SPSS Modeler expone las características principales y los parámetros de uso común. El nodo XGBoost-AS se implementa en Spark.

Tabla 1. Propiedades de xgboostasnode
Propiedades de xgboostasnode Tipo de datos Descripción de la propiedad
target_field campo Lista de los nombres de campo para el objetivo.
input_fields campo Lista de los nombres de campo para entradas.
nWorkers entero El número de trabajadores utilizados para formar el modelo XGBoost. El valor predeterminado es 1.
numThreadPerTask entero El número de hebras utilizadas por trabajador. El valor predeterminado es 1.
useExternalMemory Boolean Indica si se va a utilizar memoria externa como memoria caché. El valor predeterminado es false.
boosterType serie El tipo de amplificador para utilizar. Las opciones disponibles son gbtree, gblinear o dart. El valor predeterminado es gbtree.
numBoostRound entero El número de rondas para aumentar. Especifique un valor de 0 o superior. El valor predeterminado es 10.
scalePosWeight Double Controle el equilibrio entre ponderaciones positivas y negativas. El valor predeterminado es 1.
randomseed entero Semilla utilizada por el generador de números aleatorios. El valor predeterminado es 0.
objectiveType serie El objetivo de aprendizaje. Los valores posibles son reg:linear, reg:logistic, reg:gamma, reg:tweedie,rank:pairwise, binary:logistic o multi. Tenga en cuenta que para los destinos de distintivo, sólo se puede utilizar binary:logistic o multi. Si se utiliza multi, el resultado de la puntuación mostrará los tipos de objetivos multi:softmax y multi:softprob XGBoost. El valor predeterminado es reg:linear.
evalMetric serie Las métricas de evaluación para datos de validación. Se asignará una métrica predeterminada de acuerdo con el objetivo. Los valores posibles son rmse, mae, logloss, error, merror, mlogloss, auc, ndcg, map o gamma-deviance. El valor predeterminado es rmse.
lambda Double Término de regularización L2 en ponderaciones. Al aumentar este valor, el modelo será más conservador. Especifique cualquier número 0 o superior. El valor predeterminado es 1.
alpha Double Término de regularización L1 sobre ponderaciones. Al aumentar este valor, el modelo será más conservador. Especifique cualquier número 0 o superior. El valor predeterminado es 0.
lambdaBias Double Término de regularización L2 en sesgo. Si se utiliza el tipo de refuerzo gblinear, este parámetro de refuerzo lineal de sesgo lambda está disponible. Especifique cualquier número 0 o superior. El valor predeterminado es 0.
treeMethod serie Si se utiliza el tipo de refuerzo gbtree o dart, este parámetro de método de árbol para el crecimiento de árbol (y los demás parámetros de árbol que siguen) está disponible. Especifica el algoritmo de construcción de árbol XGBoost para utilizar. Las opciones disponibles son auto, exact o approx. El valor predeterminado es auto.
maxDepth entero La profundidad máxima para árboles. Especifique un valor de 2 o superior. El valor predeterminado es 6.
minChildWeight Double La suma mínima de la ponderación de instancias (hessiana) necesaria en un hijo. Especifique un valor de 0 o superior. El valor predeterminado es 1.
maxDeltaStep Double El paso delta máximo para permitir para la estimación ponderada de cada árbol. Especifique un valor de 0 o superior. El valor predeterminado es 0.
sampleSize Double La muestra secundaria es la proporción de la instancia de formación. Especifique un valor entre 0.1 y 1.0. El valor predeterminado es 1.0.
eta Double La reducción de tamaño de paso utilizada durante el paso para evitar el sobreajuste. Especifique un valor entre 0 y 1. El valor predeterminado es 0.3.
gamma Double La reducción de pérdida mínima necesaria para realizar una partición adicional en un nodo hoja del árbol. Especifique cualquier número 0 o superior. El valor predeterminado es 6.
colsSampleRatio Double La proporción de muestra secundaria de columnas al construir cada árbol. Especifique un valor entre 0.01 y 1. El valor predeterminado es 1.
colsSampleLevel Double La proporción de muestra secundaria de columnas para cada división, en cada nivel. Especifique un valor entre 0.01 y 1. El valor predeterminado es 1.
normalizeType serie Si se utiliza el tipo de amplificador dart, están disponibles este parámetro dart y los tres parámetros dart siguientes. Este parámetro define el algoritmo de normalización. Especifique tree o forest. El valor predeterminado es tree.
sampleType serie El tipo de algoritmo de muestreo. Especifique uniform o weighted. El valor predeterminado es uniform.
rateDrop Double El parámetro de amplificador dart de índice de descarte. Especifique un valor entre 0.0 y 1.0. El valor predeterminado es 0.0.
skipDrop Double El parámetro de amplificador dart para la probabilidad de descarte de salto. Especifique un valor entre 0.0 y 1.0. El valor predeterminado es 0.0.