Torna alla versione inglese della documentazioneProprietà xgboostasnode
Proprietà xgboostasnode
Ultimo aggiornamento: 07 ott 2024
XGBoost è un'implementazione avanzata di un algoritmo gradient boosting. Gli algoritmi Boosting rilevano in modo interattivo i classificatori deboli e li aggiungono ai classificatori forti finali. XGBoost è molto flessibile e fornisce molti parametri che possono essere travolgenti per la maggior parte degli utenti, quindi il nodo XGBoost - AS in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati. Il nodo XGBoost-AS è implementato in Spark.
Proprietà xgboostasnode |
Tipo di dati | Descrizione proprietà |
---|---|---|
target_field |
campo | Elenco dei nomi dei campi per la destinazione. |
input_fields |
campo | Elenco dei nomi dei campi per gli input. |
nWorkers |
intero | Il numero di worker utilizzati per addestrare il modello XGBoost. Il valore predefinito è 1 . |
numThreadPerTask |
intero | Il numero di thread utilizzati per worker. Il valore predefinito è 1 . |
useExternalMemory |
Booleano | Indica se utilizzare la memoria esterna come cache. Il valore predefinito è false. |
boosterType |
Stringa | Il tipo di booster da utilizzare. Le opzioni disponibili sono
gbtree , gblinear o dart . Il valore predefinito è gbtree . |
numBoostRound |
intero | Il numero di iterazioni per il boosting. Specificare
il valore 0 o un valore maggiore. L'impostazione predefinita è 10 . |
scalePosWeight |
Doppio | Controlla il bilanciamento tra i pesi positivi e negativi. Il valore predefinito è 1 . |
randomseed |
intero | Il seed utilizzato dal generatore di numeri random. Il valore predefinito è 0. |
objectiveType |
Stringa | L'obiettivo di apprendimento. I valori possibili sonoreg:linear , reg:logistic , reg:gamma , reg:tweedie ,rank:pairwise , binary:logistic o multi . Notare che per gli
obiettivi indicatore, è possibile utilizzare solo
binary:logistic o multi . Se si utilizza multi , il risultato del punteggio mostrerà i
tipi di obiettivo XGBoost multi:softmax e
multi:softprob . Il valore predefinito è reg:linear . |
evalMetric |
Stringa | Metrica di valutazione per i dati di convalida. A seconda dell'obiettivo verrà assegnata
una metrica predefinita. I valori possibili sono rmse , mae ,
logloss , error , merror ,
mlogloss , auc , ndcg ,
map o gamma-deviance . Il valore predefinito è rmse . |
lambda |
Doppio | Termine di regolarizzazione L2 sui pesi. L'incremento di questo valore renderà il modello più conservativo. Specificare 0 o un
valore maggiore. L'impostazione predefinita è 1 . |
alpha |
Doppio | Il termine di regolarizzazione L1 sui pesi. L'incremento di questo valore renderà il modello più conservativo. Specificare 0 o un
valore maggiore. L'impostazione predefinita è 0 . |
lambdaBias |
Doppio | Termine di regolarizzazione L2 sulla distorsione. Se si utilizza il tipo
di booster gblinear , questo parametro booster linear di
distorsione lambda sarà disponibile. Specificare 0 o un
valore maggiore. Il valore predefinito è
0 . |
treeMethod |
Stringa | Se si utilizza il tipo di booster gbtree o
dart , questo parametro metodo struttura ad albero per la
crescita della struttura ad albero (e gli altri parametri della struttura
albero correlati) è disponibile. Specifica l'algoritmo di costruzione della
struttura ad albero XGBoost da utilizzare. Le opzioni disponibili sono auto , exact o approx . Il valore predefinito è auto . |
maxDepth |
intero | La profondità massima delle strutture ad albero. Specificare
il valore 2 o un valore maggiore. L'impostazione predefinita è 6 . |
minChildWeight |
Doppio | La somma minima dei pesi delle istanze (hessiana) necessaria in un
figlio. Specificare
il valore 0 o un valore maggiore. L'impostazione predefinita è 1 . |
maxDeltaStep |
Doppio | Il massimo passo delta da consentire per ciascuna stima del peso di una
struttura ad albero. Specificare
il valore 0 o un valore maggiore. L'impostazione predefinita è 0 . |
sampleSize |
Doppio | Il Campione secondario è il rapporto dell'istanza di apprendimento. Specificare un valore compreso tra 0.1 e 1.0 . Il valore predefinito è
1.0 . |
eta |
Doppio | La riduzione della dimensione del passo utilizzata durante il passo di aggiornamento per evitare il sovradattamento. Specificare un valore compreso tra 0 e 1 . Il valore predefinito è 0.3 . |
gamma |
Doppio | La minima riduzione delle perdite necessaria per creare un ulteriore partizione nel nodo foglia di una struttura ad albero. Specificare 0 o un
valore maggiore. L'impostazione predefinita è 6 . |
colsSampleRatio |
Doppio | Il rapporto Campione secondario di colonne nella creazione di ciascuna
struttura ad albero. Specificare un valore compreso tra 0.01 e 1 . Il valore predefinito è1 . |
colsSampleLevel |
Doppio | Il rapporto Campione secondario di colonne per ciascuna suddivisione, in
ciascun livello. Specificare un valore compreso tra 0.01 e 1 . Il valore predefinito è
1 . |
normalizeType |
Stringa | Se si utilizza il tipo booster dart, questo parametro dart ed i seguenti
tre parametri dart saranno disponibili. Questo parametro imposta l'algoritmo di normalizzazione. Specificare
tree o
forest . Il valore predefinito è tree . |
sampleType |
Stringa | Il tipo di algoritmo di campionamento. Specificare
uniform o
weighted . Il valore predefinito è uniform . |
rateDrop |
Doppio | Il parametro booster dart del tasso di dropout. Specificare un valore compreso tra 0.0 e 1.0 . Il valore predefinito è 0.0 . |
skipDrop |
Doppio | Il parametro booster dart per la probabilità di ignorare dropout. Specificare un valore compreso tra 0.0 e 1.0 . Il valore predefinito è 0.0 . |