0 / 0
Torna alla versione inglese della documentazione
Proprietà xgboostasnode
Ultimo aggiornamento: 07 ott 2024
Proprietà xgboostasnode

Icona nodo XGBoost-ASXGBoost è un'implementazione avanzata di un algoritmo gradient boosting. Gli algoritmi Boosting rilevano in modo interattivo i classificatori deboli e li aggiungono ai classificatori forti finali. XGBoost è molto flessibile e fornisce molti parametri che possono essere travolgenti per la maggior parte degli utenti, quindi il nodo XGBoost - AS in SPSS Modeler espone le funzioni principali e i parametri comunemente utilizzati. Il nodo XGBoost-AS è implementato in Spark.

Tabella 1. Proprietà xgboostasnode
Proprietà xgboostasnode Tipo di dati Descrizione proprietà
target_field campo Elenco dei nomi dei campi per la destinazione.
input_fields campo Elenco dei nomi dei campi per gli input.
nWorkers intero Il numero di worker utilizzati per addestrare il modello XGBoost. Il valore predefinito è 1.
numThreadPerTask intero Il numero di thread utilizzati per worker. Il valore predefinito è 1.
useExternalMemory Booleano Indica se utilizzare la memoria esterna come cache. Il valore predefinito è false.
boosterType Stringa Il tipo di booster da utilizzare. Le opzioni disponibili sono gbtree, gblinear o dart. Il valore predefinito è gbtree.
numBoostRound intero Il numero di iterazioni per il boosting. Specificare il valore 0 o un valore maggiore. L'impostazione predefinita è 10.
scalePosWeight Doppio Controlla il bilanciamento tra i pesi positivi e negativi. Il valore predefinito è 1.
randomseed intero Il seed utilizzato dal generatore di numeri random. Il valore predefinito è 0.
objectiveType Stringa L'obiettivo di apprendimento. I valori possibili sonoreg:linear, reg:logistic, reg:gamma, reg:tweedie,rank:pairwise, binary:logistico multi. Notare che per gli obiettivi indicatore, è possibile utilizzare solo binary:logistic o multi. Se si utilizza multi, il risultato del punteggio mostrerà i tipi di obiettivo XGBoost multi:softmax e multi:softprob. Il valore predefinito è reg:linear.
evalMetric Stringa Metrica di valutazione per i dati di convalida. A seconda dell'obiettivo verrà assegnata una metrica predefinita. I valori possibili sono rmse, mae, logloss, error, merror, mlogloss, auc, ndcg, map o gamma-deviance. Il valore predefinito è rmse.
lambda Doppio Termine di regolarizzazione L2 sui pesi. L'incremento di questo valore renderà il modello più conservativo. Specificare 0 o un valore maggiore. L'impostazione predefinita è 1.
alpha Doppio Il termine di regolarizzazione L1 sui pesi. L'incremento di questo valore renderà il modello più conservativo. Specificare 0 o un valore maggiore. L'impostazione predefinita è 0.
lambdaBias Doppio Termine di regolarizzazione L2 sulla distorsione. Se si utilizza il tipo di booster gblinear, questo parametro booster linear di distorsione lambda sarà disponibile. Specificare 0 o un valore maggiore. Il valore predefinito è 0.
treeMethod Stringa Se si utilizza il tipo di booster gbtree o dart, questo parametro metodo struttura ad albero per la crescita della struttura ad albero (e gli altri parametri della struttura albero correlati) è disponibile. Specifica l'algoritmo di costruzione della struttura ad albero XGBoost da utilizzare. Le opzioni disponibili sono auto, exacto approx. Il valore predefinito è auto.
maxDepth intero La profondità massima delle strutture ad albero. Specificare il valore 2 o un valore maggiore. L'impostazione predefinita è 6.
minChildWeight Doppio La somma minima dei pesi delle istanze (hessiana) necessaria in un figlio. Specificare il valore 0 o un valore maggiore. L'impostazione predefinita è 1.
maxDeltaStep Doppio Il massimo passo delta da consentire per ciascuna stima del peso di una struttura ad albero. Specificare il valore 0 o un valore maggiore. L'impostazione predefinita è 0.
sampleSize Doppio Il Campione secondario è il rapporto dell'istanza di apprendimento. Specificare un valore compreso tra 0.1 e 1.0. Il valore predefinito è 1.0.
eta Doppio La riduzione della dimensione del passo utilizzata durante il passo di aggiornamento per evitare il sovradattamento. Specificare un valore compreso tra 0 e 1. Il valore predefinito è 0.3.
gamma Doppio La minima riduzione delle perdite necessaria per creare un ulteriore partizione nel nodo foglia di una struttura ad albero. Specificare 0 o un valore maggiore. L'impostazione predefinita è 6.
colsSampleRatio Doppio Il rapporto Campione secondario di colonne nella creazione di ciascuna struttura ad albero. Specificare un valore compreso tra 0.01 e 1. Il valore predefinito è1.
colsSampleLevel Doppio Il rapporto Campione secondario di colonne per ciascuna suddivisione, in ciascun livello. Specificare un valore compreso tra 0.01 e 1. Il valore predefinito è 1.
normalizeType Stringa Se si utilizza il tipo booster dart, questo parametro dart ed i seguenti tre parametri dart saranno disponibili. Questo parametro imposta l'algoritmo di normalizzazione. Specificare tree o forest. Il valore predefinito è tree.
sampleType Stringa Il tipo di algoritmo di campionamento. Specificare uniform o weighted. Il valore predefinito è uniform.
rateDrop Doppio Il parametro booster dart del tasso di dropout. Specificare un valore compreso tra 0.0 e 1.0. Il valore predefinito è 0.0.
skipDrop Doppio Il parametro booster dart per la probabilità di ignorare dropout. Specificare un valore compreso tra 0.0 e 1.0. Il valore predefinito è 0.0.
Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni