Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04 lip 2023
XGBoost to zaawansowana implementacja algorytmu wzmacniania gradientowego. Algorytmy wzmacniania iteracyjnie ucząc się, wyznaczają słabe klasyfikatory i dodają je do ostatecznego silnego klasyfikatora. XGBoost jest bardzo elastyczny i udostępnia wiele parametrów, które mogą być przytłaczające dla większości użytkowników, dlatego węzeł XGBoost-AS w programie SPSS Modeler ujawnia podstawowe funkcje i powszechnie używane parametry. Węzeł XGBoost-AS jest zaimplementowany w środowisku Spark.
Właściwości węzła xgboostasnode |
Typ danych | Opis właściwości |
---|---|---|
target_field |
field (pole) | Lista zmiennych przewidywanych. |
input_fields |
field (pole) | Lista zmiennych wejściowych. |
nWorkers |
liczba całkowita | Liczba procesów roboczych używanych do uczenia modelu XGBoost. Wartością domyślną jest 1 . |
numThreadPerTask |
liczba całkowita | Liczba wątków przypadająca na jeden proces roboczy. Wartością domyślną jest 1 . |
useExternalMemory |
Wartość boolowska | Określa, czy używać pamięci zewnętrznej jako podręcznej. Wartością domyślną jest false. |
boosterType |
łańcuch | Typ wzmocnienia, który ma być używany. Dostępne opcje to: gbtree ,
gblinear i dart . Typ domyślny to gbtree . |
numBoostRound |
liczba całkowita | Liczba rund wzmocnienia. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 10 . |
scalePosWeight |
Podwójna | Steruje równoważeniem wag dodatnich i ujemnych. Wartością domyślną jest 1 . |
randomseed |
liczba całkowita | Wartość początkowa używana przez generator liczb losowych. Wartością domyślną jest 0. |
objectiveType |
łańcuch | Cel uczenia. Możliwe wartości to reg:linear , reg:logistic , reg:gamma , reg:tweedie , rank:pairwise , binary:logistic lub multi . Należy pamiętać, że w przypadku zmiennych przewidywanych typu flaga można używać tylko wartości binary:logistic lub multi . W razie użycia wartości multi wynik oceny będzie przedstawiał typy celów XGBoost multi:softmax i multi:softprob . Wartość domyślna to reg:linear . |
evalMetric |
łańcuch | Metryka ewaluacyjna dla danych walidacji. Zgodnie z celem zostanie przypisana metryka domyślna. Możliwe wartości to rmse , mae ,
logloss , error , merror ,
mlogloss , auc , ndcg , map i
gamma-deviance . Wartość domyślna to rmse . |
lambda |
Podwójna | Składnik regularyzacji L2 wag. Zwiększenie tej wartości powoduje, że model jest bardziej konserwatywny. Należy określić wartość 0 lub większą. Wartością domyślną jest 1 . |
alpha |
Podwójna | Składnik regularyzacji L1 wag. Zwiększenie tej wartości powoduje, że model jest bardziej konserwatywny. Należy określić wartość 0 lub większą. Wartością domyślną jest 0 . |
lambdaBias |
Podwójna | Składnik regularyzacji L2 obciążenia. Jeśli używany jest typ wzmocnienia gblinear , dostępny jest ten parametr obciążenia lambda wzmocnienia liniowego. Należy określić wartość 0 lub większą. Wartością domyślną jest 0 . |
treeMethod |
łańcuch | Jeśli używany jest typ wzmocnienia gbtree lub dart , dostępny jest ten parametr metody wzrostu drzewa (oraz inne parametry drzewa, które po nim następują). Określa algorytm tworzenia drzewa XGBoost. Dostępne opcje to auto , exact lub approx . Wartością domyślną jest auto . |
maxDepth |
liczba całkowita | Maksymalna głębokość drzew. Należy określić wartość 2 lub wyższą. Wartością domyślną jest 6 . |
minChildWeight |
Podwójna | Minimalna suma wag wystąpień (Hessego) wymagana w elemencie podrzędnym. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 1 . |
maxDeltaStep |
Podwójna | Maksymalny krok zmiany umożliwiający oszacowanie wag każdego drzewa. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 0 . |
sampleSize |
Podwójna | Podpróba określa współczynnik wystąpień używanych do uczenia. Określ wartość z zakresu od 0.1 do 1.0 . Wartością domyślną jest 1.0 . |
eta |
Podwójna | Redukcja wielkości kroku używana podczas aktualizacji w celu zapobiegania przeuczeniu. Określ wartość z zakresu od 0 do 1 . Wartością domyślną jest 0.3 . |
gamma |
Podwójna | Minimalna redukcja straty wymagana do dalszego podziału węzła-liścia w drzewie. Należy określić wartość 0 lub większą. Wartością domyślną jest 6 . |
colsSampleRatio |
Podwójna | Współczynnik podpróbkowania kolumn podczas tworzenia każdego drzewa. Określ wartość z zakresu od 0.01 do 1 . Wartością domyślną jest 1 . |
colsSampleLevel |
Podwójna | Współczynnik podpróbkowania kolumn dla każdego podziału na każdym poziomie. Określ wartość z zakresu od 0.01 do 1 . Wartością domyślną jest 1 . |
normalizeType |
łańcuch | Jeśli używany jest typ wzmocnienia dart, dostępny jest ten parametr dart i trzy następujące po nim parametry. Ten parametr określa algorytm normalizacji. Określ tree albo forest . Algorytm domyślny to tree . |
sampleType |
łańcuch | Typ algorytmu próbkowania. Określ uniform albo weighted . Algorytm domyślny to uniform . |
rateDrop |
Podwójna | Współczynnik wypadania dla wzmocnienia typu dart. Określ wartość z zakresu od 0.0 do 1.0 . Algorytm domyślny to 0.0 . |
skipDrop |
Podwójna | Prawdopodobieństwo pominiętego wypadnięcia dla wzmocnienia typu dart. Określ wartość z zakresu od 0.0 do 1.0 . Algorytm domyślny to 0.0 . |