資料の 英語版 に戻るsmotenode のプロパティ
smotenode のプロパティ
最終更新: 2024年10月04日
SMOTE (Synthetic Minority Over-sampling Technique) ノードは不均衡データ・セットを扱うためのオーバーサンプリング・アルゴリズムを提供します。 これにより、データの均衡化のための高度な手法が提供されます。 SPSS Modeler の SMOTE プロセス・ノードは Python で実装されており、 imbalanced-learn© Python ライブラリーを必要とします。
smotenode プロパティー |
データ・タイプ | プロパティーの説明 |
---|---|---|
target |
フィールド | 対象フィールド。 |
sample_ratio |
string | カスタムの比率の値を使用できるようにします。 2 つのオプションは、「自動」(sample_ratio_auto ) または「比率の設定」(sample_ratio_manual ) です。 |
sample_ratio_value |
浮動小数点 | これは、マジョリティー クラスのサンプル数に対するマイノリティー クラスのサンプル数の比率です。 これは、0 より大きく、1 以下でなければなりません。 デフォルトはauto です。 |
enable_random_seed |
ブール値 | true に設定すると、random_seed プロパティーが有効になります。 |
random_seed |
整数 | 乱数発生ルーチンによって使用されるシード。 |
k_neighbours |
整数 | 合成サンプルの作成に使用する最近傍の数です。 デフォルトは5 です。 |
m_neighbours |
整数 | 少数派サンプルが危険な状態にあるかどうかを判別するために使用される最近傍の数です。 このオプションは、SMOTE アルゴリズム・タイプborderline1 およびborderline2 でのみ使用可能です。 デフォルトは10 です。 |
algorithm |
string | SMOTE アルゴリズムのタイプ: regular 、borderline1 、またはborderline2 。 |
use_partition |
ブール値 | true に設定すると、トレーニング・データのみがモデル作成に使用されます。 デフォルトはtrue です。 |