0 / 0
Go back to the English version of the documentation
Właściwości węzła xgboostasnode
Last updated: 04 lip 2023
Właściwości węzła xgboostasnode

Ikona węzła XGBoost-ASXGBoost to zaawansowana implementacja algorytmu wzmacniania gradientowego. Algorytmy wzmacniania iteracyjnie ucząc się, wyznaczają słabe klasyfikatory i dodają je do ostatecznego silnego klasyfikatora. XGBoost jest bardzo elastyczny i udostępnia wiele parametrów, które mogą być przytłaczające dla większości użytkowników, dlatego węzeł XGBoost-AS w programie SPSS Modeler ujawnia podstawowe funkcje i powszechnie używane parametry. Węzeł XGBoost-AS jest zaimplementowany w środowisku Spark.

Tabela 1. Właściwości węzła xgboostasnode
Właściwości węzła xgboostasnode Typ danych Opis właściwości
target_field field (pole) Lista zmiennych przewidywanych.
input_fields field (pole) Lista zmiennych wejściowych.
nWorkers liczba całkowita Liczba procesów roboczych używanych do uczenia modelu XGBoost. Wartością domyślną jest 1.
numThreadPerTask liczba całkowita Liczba wątków przypadająca na jeden proces roboczy. Wartością domyślną jest 1.
useExternalMemory Wartość boolowska Określa, czy używać pamięci zewnętrznej jako podręcznej. Wartością domyślną jest false.
boosterType łańcuch Typ wzmocnienia, który ma być używany. Dostępne opcje to: gbtree, gblinear i dart. Typ domyślny to gbtree.
numBoostRound liczba całkowita Liczba rund wzmocnienia. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 10.
scalePosWeight Podwójna Steruje równoważeniem wag dodatnich i ujemnych. Wartością domyślną jest 1.
randomseed liczba całkowita Wartość początkowa używana przez generator liczb losowych. Wartością domyślną jest 0.
objectiveType łańcuch Cel uczenia. Możliwe wartości to reg:linear, reg:logistic, reg:gamma, reg:tweedie, rank:pairwise, binary:logistic lub multi. Należy pamiętać, że w przypadku zmiennych przewidywanych typu flaga można używać tylko wartości binary:logistic lub multi. W razie użycia wartości multi wynik oceny będzie przedstawiał typy celów XGBoost multi:softmax i multi:softprob. Wartość domyślna to reg:linear.
evalMetric łańcuch Metryka ewaluacyjna dla danych walidacji. Zgodnie z celem zostanie przypisana metryka domyślna. Możliwe wartości to rmse, mae, logloss, error, merror, mlogloss, auc, ndcg, map i gamma-deviance. Wartość domyślna to rmse.
lambda Podwójna Składnik regularyzacji L2 wag. Zwiększenie tej wartości powoduje, że model jest bardziej konserwatywny. Należy określić wartość 0 lub większą. Wartością domyślną jest 1.
alpha Podwójna Składnik regularyzacji L1 wag. Zwiększenie tej wartości powoduje, że model jest bardziej konserwatywny. Należy określić wartość 0 lub większą. Wartością domyślną jest 0.
lambdaBias Podwójna Składnik regularyzacji L2 obciążenia. Jeśli używany jest typ wzmocnienia gblinear, dostępny jest ten parametr obciążenia lambda wzmocnienia liniowego. Należy określić wartość 0 lub większą. Wartością domyślną jest 0.
treeMethod łańcuch Jeśli używany jest typ wzmocnienia gbtree lub dart, dostępny jest ten parametr metody wzrostu drzewa (oraz inne parametry drzewa, które po nim następują). Określa algorytm tworzenia drzewa XGBoost. Dostępne opcje to auto, exact lub approx. Wartością domyślną jest auto.
maxDepth liczba całkowita Maksymalna głębokość drzew. Należy określić wartość 2 lub wyższą. Wartością domyślną jest 6.
minChildWeight Podwójna Minimalna suma wag wystąpień (Hessego) wymagana w elemencie podrzędnym. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 1.
maxDeltaStep Podwójna Maksymalny krok zmiany umożliwiający oszacowanie wag każdego drzewa. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 0.
sampleSize Podwójna Podpróba określa współczynnik wystąpień używanych do uczenia. Określ wartość z zakresu od 0.1 do 1.0. Wartością domyślną jest 1.0.
eta Podwójna Redukcja wielkości kroku używana podczas aktualizacji w celu zapobiegania przeuczeniu. Określ wartość z zakresu od 0 do 1. Wartością domyślną jest 0.3.
gamma Podwójna Minimalna redukcja straty wymagana do dalszego podziału węzła-liścia w drzewie. Należy określić wartość 0 lub większą. Wartością domyślną jest 6.
colsSampleRatio Podwójna Współczynnik podpróbkowania kolumn podczas tworzenia każdego drzewa. Określ wartość z zakresu od 0.01 do 1. Wartością domyślną jest 1.
colsSampleLevel Podwójna Współczynnik podpróbkowania kolumn dla każdego podziału na każdym poziomie. Określ wartość z zakresu od 0.01 do 1. Wartością domyślną jest 1.
normalizeType łańcuch Jeśli używany jest typ wzmocnienia dart, dostępny jest ten parametr dart i trzy następujące po nim parametry. Ten parametr określa algorytm normalizacji. Określ tree albo forest. Algorytm domyślny to tree.
sampleType łańcuch Typ algorytmu próbkowania. Określ uniform albo weighted. Algorytm domyślny to uniform.
rateDrop Podwójna Współczynnik wypadania dla wzmocnienia typu dart. Określ wartość z zakresu od 0.0 do 1.0. Algorytm domyślny to 0.0.
skipDrop Podwójna Prawdopodobieństwo pominiętego wypadnięcia dla wzmocnienia typu dart. Określ wartość z zakresu od 0.0 do 1.0. Algorytm domyślny to 0.0.
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more