0 / 0
Go back to the English version of the documentation
Właściwości xgboosttreenode
Last updated: 12 sty 2023
Właściwości xgboosttreenode

Ikona węzła drzewa XGBoostXGBoost Tree© to zaawansowana implementacja algorytmu wzmacniania gradientowego, który jako model bazowy wykorzystuje model drzewa. Algorytmy wzmacniania iteracyjnie ucząc się, wyznaczają słabe klasyfikatory i dodają je do ostatecznego silnego klasyfikatora. Drzewo XGBoost jest bardzo elastyczne i udostępnia wiele parametrów, które mogą być przytłaczające dla większości użytkowników, dlatego węzeł drzewa XGBoost w programie SPSS Modeler ujawnia podstawowe funkcje i powszechnie używane parametry. Węzeł jest zaimplementowany w języku Python.

Tabela 1. Właściwości węzła xgboosttreenode
Właściwości xgboosttreenode Typ danych Opis właściwości
custom_fields boolean (boolowskie) Ta opcja stanowi dla węzła instrukcję o konieczności użycia informacji o zmiennej określonych w tym miejscu, a nie w żadnym wcześniejszym węźle Typy. Po wybraniu tej opcji należy określić pola zgodnie z wymaganiami.
target field (pole) Zmienne przewidywane.
inputs field (pole) Zmienne wejściowe.
tree_method łańcuch Metoda drzewa dla budowania modelu. Dopuszczalne wartości to: auto, exact lub approx. Wartością domyślną jest auto.
num_boost_round liczba całkowita Wartość zaokrąglania num boost dla budowania modelu. Należy określić wartość z zakresu od 1 do 1000. Wartością domyślną jest 10.
max_depth liczba całkowita Maksymalna głębokość dla wzrostu drzewa. Należy określić wartość 1 lub wyższą. Wartością domyślną jest 6.
min_child_weight Podwójna Minimalna waga elementu podrzędnego dla wzrostu drzewa. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 1.
max_delta_step Podwójna Maksymalny krok delta dla wzrostu drzewa. Należy określić wartość 0 lub wyższą. Wartością domyślną jest 0.
objective_type łańcuch Typ celu dla zadania uczenia. Możliwe wartości to:reg:linear, reg:logistic, reg:gamma, reg:tweedie,count:poisson,rank:pairwise, binary:logisticlub multi. Należy pamiętać, że w przypadku zmiennych przewidywanych typu flaga można używać tylko wartości binary:logistic lub multi. W razie użycia wartości multi wynik oceny będzie przedstawiał typy celów XGBoost multi:softmax i multi:softprob.
early_stopping Wartość boolowska Aby skorzystać z funkcji przedwczesnego zatrzymywania. Wartością domyślną jest False.
early_stopping_rounds liczba całkowita Aby uczenie było kontynuowane, błędy walidacji muszą zmniejszać się co najmniej co określoną liczbę rund. Wartością domyślną jest 10.
evaluation_data_ratio Podwójna Współczynnik danych wejściowych używanych dla błędów walidacji. Wartością domyślną jest 0.3.
random_seed liczba całkowita Wartość początkowa liczb losowych. Jest to dowolna liczba z zakresu od 0 do 9999999. Wartością domyślną jest 0.
sample_size Podwójna Podpróby do sterowania przeuczeniem. Należy określić wartość z zakresu od 0.1 do 1.0. Wartością domyślną jest 0.1.
eta Podwójna Wartość eta do sterowania przeuczeniem. Należy określić wartość z zakresu od 0 do 1. Wartością domyślną jest 0.3.
gamma Podwójna Wartość gamma do sterowania przeuczeniem. Należy określić wartość 0 lub większą. Wartością domyślną jest 6.
col_sample_ratio Podwójna Wartość colsample by tree do sterowania przeuczeniem. Należy określić wartość z zakresu od 0.01 do 1. Wartością domyślną jest 1.
col_sample_level Podwójna Wartość colsample by level do sterowania przeuczeniem. Należy określić wartość z zakresu od 0.01 do 1. Wartością domyślną jest 1.
lambda Podwójna Wartość lambda do sterowania przeuczeniem. Należy określić wartość 0 lub większą. Wartością domyślną jest 1.
alpha Podwójna Wartość alpha do sterowania przeuczeniem. Należy określić wartość 0 lub większą. Wartością domyślną jest 0.
scale_pos_weight Podwójna Wartość wagi scale pos do obsługi niezrównoważonych zbiorów danych. Wartością domyślną jest 1.
use_HPO