資料の 英語版 に戻るxgboostasnode プロパティー
xgboostasnode プロパティー
最終更新: 2024年10月04日
XGBoost は、勾配ブースティング・アルゴリズムの高度な実装です。 ブースティング・アルゴリズムでは、弱い分類子に繰り返し学習させ、それを最終的な強い分類子に追加します。 XGBoost は柔軟性が極めて高く、多くのユーザーを圧倒するほどの多数のパラメータが用意されています。このため、SPSS Modeler の XGBoost-AS ノードでは、コア・フィーチャーおよびよく使用されるパラメータが公開されています。 XGBoost-AS ノードは Spark で実装されています。
xgboostasnode プロパティー |
データ・タイプ | プロパティーの説明 |
---|---|---|
target_field |
フィールド | 対象のフィールド名のリスト。 |
input_fields |
フィールド | 入力用のフィールド名のリスト。 |
nWorkers |
整数 | XGBoost モデルの学習に使用するワーカーの数。 デフォルトは1 です。 |
numThreadPerTask |
整数 | ワーカーごとに使用するスレッドの数。 デフォルトは1 です。 |
useExternalMemory |
ブール値 | キャッシュとして外部メモリーを使用するかどうか。 デフォルトは falseです。 |
boosterType |
string | 使用するブースティング タイプ。 使用可能なオプションは、gbtree 、gblinear 、またはdart です。 デフォルトはgbtree です。 |
numBoostRound |
整数 | ブースティングのラウンド数。 0 以上の値を指定してください。 デフォルトは10 です。 |
scalePosWeight |
二重 | 正の重みと負の重みのバランスを制御します。 デフォルトは1 です。 |
randomseed |
整数 | 乱数発生ルーチンによって使用されるシード。 デフォルトは 0です。 |
objectiveType |
string | 学習目的。 可能な値は、reg:linear 、reg:logistic 、reg:gamma 、reg:tweedie 、rank:pairwise 、binary:logistic 、またはmulti です。 フラグ型対象の場合は、binary:logistic またはmulti のみを使用できることに注意してください。 multi を使用した場合、スコア結果にはmulti:softmax およびmulti:softprob XGBoost の目的タイプが表示されます。 デフォルトは reg:linear です。 |
evalMetric |
string | 検証データの評価メトリック。 デフォルトのメトリックは、目的に応じて割り当てられます。 可能な値は、rmse 、mae 、logloss 、error 、merror 、mlogloss 、auc 、ndcg 、map 、またはgamma-deviance です。 デフォルトは rmse です。 |
lambda |
二重 | 重みに関する L2 正規化項。 この値を大きくすると、モデルがより保守的になります。 0 以上の数値を指定します。 デフォルトは1 です。 |
alpha |
二重 | 重みに関する L1 正規化項。 この値を大きくすると、モデルがより保守的になります。 0 以上の数値を指定します。 デフォルトは0 です。 |
lambdaBias |
二重 | 偏りに関する L2 正規化項。 gblinear ブースター・タイプを使用する場合、このラムダ・バイアス線形ブースター・パラメーターを使用できます。 0 以上の数値を指定します。 デフォルトは0 です。 |
treeMethod |
string | gbtree またはdart ブースター・タイプが使用されている場合、ツリーの成長のためのこのツリー・メソッド・パラメーター (およびそれに続くその他のツリー・パラメーター) を使用できます。 これは、使用する XGBoost ツリー構築アルゴリズムを指定します。 使用可能なオプションは、auto 、exact 、またはapprox です。 デフォルトはauto です。 |
maxDepth |
整数 | ツリーの最大深度。 2 以上の値を指定してください。 デフォルトは6 です。 |
minChildWeight |
二重 | 子で必要なインスタンスの重み (ヘシアン) の最小合計。 0 以上の値を指定してください。 デフォルトは1 です。 |
maxDeltaStep |
二重 | 各ツリーの重みを推定できるようにするための差分ステップの最大数。 0 以上の値を指定してください。 デフォルトは0 です。 |
sampleSize |
二重 | サブサンプルは、学習インスタンスの比率を示します。 0.1 と1.0 の間の値を指定します。 デフォルトは1.0 です。 |
eta |
二重 | オーバーフィッティングを防ぐために更新ステップ中に使用するステップ サイズの収縮。 0 と1 の間の値を指定します。 デフォルトは0.3 です。 |
gamma |
二重 | ツリーの葉ノードをさらに分割するために必要な最小の損失低減。 0 以上の数値を指定します。 デフォルトは6 です。 |
colsSampleRatio |
二重 | 各ツリーを構築する際の、列のサブサンプルの比率。 0.01 と1 の間の値を指定します。 デフォルトは1 です。 |
colsSampleLevel |
二重 | 各分割における、各レベルでの列のサブサンプルの比率。 0.01 と1 の間の値を指定します。 デフォルトは1 です。 |
normalizeType |
string | dart ブースティング タイプが使用されている場合は、この dart パラメータおよび以下の 3 つの dart パラメータを使用できます。 このパラメータは、正規化アルゴリズムを設定します。 tree または forest を指定します。 デフォルトはtree です。 |
sampleType |
string | サンプリング アルゴリズム タイプ。 uniform または weighted を指定します。 デフォルトはuniform です。 |
rateDrop |
二重 | ドロップアウト率 dart ブースティング パラメータ。 0.0 と1.0 の間の値を指定します。 デフォルトは0.0 です。 |
skipDrop |
二重 | スキップ ドロップアウトの確率の dart ブースティング パラメータ。 0.0 と1.0 の間の値を指定します。 デフォルトは0.0 です。 |