Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 04. 7. 2023
XGBoost je rozšířená implementace algoritmu zvýšení gradientu. Posilovací algoritmy iterativně učí slabé klasifikátory a pak je přidávají do konečného silného klasifikátoru. Komponenta XGBoost je velmi flexibilní a poskytuje mnoho parametrů, které mohou být pro většinu uživatelů ohromující, takže uzel XGBoost-AS v produktu SPSS Modeler odkrývá základní funkce a běžně používané parametry. Uzel XGBoost-AS je implementován v Spark.
xgboostasnode vlastnosti |
Datový typ | Popis vlastnosti |
---|---|---|
target_field |
pole | Seznam názvů polí pro cíl. |
input_fields |
pole | Seznam názvů polí pro vstupy. |
nWorkers |
celočíselná hodnota | Počet pracovníků použitých pro výcvik modelu XGBoost. Předvolba je 1 . |
numThreadPerTask |
celočíselná hodnota | Počet použitých podprocesů na pracovníka. Předvolba je 1 . |
useExternalMemory |
Logická hodnota | Zda se má použít externí paměť jako mezipaměť. Výchozí hodnota je false. |
boosterType |
řetězec | Přídavný typ, který se má použít. Dostupné volby jsou gbtree , gblinear nebo dart . Předvolba je gbtree . |
numBoostRound |
celočíselná hodnota | Počet kol pro posílení. Zadejte hodnotu 0 nebo vyšší. Předvolba je 10 . |
scalePosWeight |
Dvojitá čára | Kontrola váhy kladných a záporných vah. Předvolba je 1 . |
randomseed |
celočíselná hodnota | Osivo použité generátorem náhodných čísel. Výchozí hodnota je 0. |
objectiveType |
řetězec | Cíl výuky. Možné hodnoty jsoureg:linear , reg:logistic , reg:gamma , reg:tweedie ,rank:pairwise , binary:logistic , nebo multi . Všimněte si, že pro cíle parametrů lze použít pouze binary:logistic nebo multi . Je-li použit příznak multi , výsledek skóre zobrazí typy cílů multi:softmax a multi:softprob XGBoost. Předvolba je reg:linear . |
evalMetric |
řetězec | Metriky vyhodnocení pro data ověření platnosti. Výchozí metrika bude přiřazena podle cíle. Možné hodnoty jsou rmse , mae , logloss , error , merror , mlogloss , auc , ndcg , map , nebo gamma-deviance . Předvolba je rmse . |
lambda |
Dvojitá čára | Termín regulizace L2 pro váhy. Zvýšením této hodnoty zvýšíme svůj model konzervativnějším. Uveďte libovolné číslo 0 nebo vyšší. Předvolba je 1 . |
alpha |
Dvojitá čára | Termín regularizace L1 pro váhy. Zvýšením této hodnoty zvýšíme svůj model konzervativnějším. Uveďte libovolné číslo 0 nebo vyšší. Předvolba je 0 . |
lambdaBias |
Dvojitá čára | Termín regulizace L2 pro posun. Je-li použit typ přídavného zařízení gblinear , je k dispozici tento lambdý lineární přídavný parametr. Uveďte libovolné číslo 0 nebo vyšší. Předvolba je 0 . |
treeMethod |
řetězec | Je-li použit přídavný typ gbtree nebo dart , je k dispozici tento parametr stromového parametru pro růst stromu (a ostatní parametry stromu, které následují). Určuje algoritmus konstrukce stromu XGBoost, který má být použit. Dostupné volby jsou auto , exact nebo approx . Předvolba je auto . |
maxDepth |
celočíselná hodnota | Maximální hloubka pro stromy. Zadejte hodnotu 2 nebo vyšší. Předvolba je 6 . |
minChildWeight |
Dvojitá čára | Minimální součet váhy instance (hesian) potřebný v podřízeném prvku. Zadejte hodnotu 0 nebo vyšší. Předvolba je 1 . |
maxDeltaStep |
Dvojitá čára | Maximální rozdílový krok, který umožní odhad hmotnosti každého stromu. Zadejte hodnotu 0 nebo vyšší. Předvolba je 0 . |
sampleSize |
Dvojitá čára | Dílčí vzorek je poměr úrovně školení. Zadejte hodnotu mezi 0.1 a 1.0 . Předvolba je 1.0 . |
eta |
Dvojitá čára | Zmenšovací velikost kroku použitá během kroku aktualizace, aby se zabránilo přeplnění. Zadejte hodnotu mezi 0 a 1 . Předvolba je 0.3 . |
gamma |
Dvojitá čára | Minimální snížení ztráty požadované k vytvoření další oblasti v koncovém uzlu stromu. Uveďte libovolné číslo 0 nebo vyšší. Předvolba je 6 . |
colsSampleRatio |
Dvojitá čára | Poměr podvzorku sloupců při konstrukci každého stromu. Zadejte hodnotu mezi 0.01 a 1 . Předvolba je1 . |
colsSampleLevel |
Dvojitá čára | Dílčí vzorek poměru sloupců pro každé rozdělení, v každé úrovni. Zadejte hodnotu mezi 0.01 a 1 . Předvolba je 1 . |
normalizeType |
řetězec | Je-li použit přídavný typ dart, je k dispozici tento parametr dart a následující tři parametry dart. Tento parametr nastavuje normalizační algoritmus. Uveďte tree nebo forest . Předvolba je tree . |
sampleType |
řetězec | Typ vzorkovací algoritmu. Uveďte uniform nebo weighted . Předvolba je uniform . |
rateDrop |
Dvojitá čára | Posilovací parametr dart posite posirate. Zadejte hodnotu mezi 0.0 a 1.0 . Předvolba je 0.0 . |
skipDrop |
Dvojitá čára | Posilovací parametr dart pro pravděpodobnost, že vynechte dropout. Zadejte hodnotu mezi 0.0 a 1.0 . Předvolba je 0.0 . |