資料の 英語版 に戻るバランス・ノード
バランス・ノード (SPSS Modeler)
最終更新: 2025年2月12日
バランス・ノードを使用して、データ・セットの不均衡を修正し、指定したテスト基準を満たすことができます。
例えば、データ・セットに 2 つの値 (low
または high
) のみがあり、90% のケースが low
で、10% のケースのみが high
であるとします。 このようにデータが偏っている場合、低の結果だけが学習され、より少ない高の結果は無視される傾向があるため、多くのモデリング手法で問題となります。 データのバランスが取れており、 low
と high
の結果の数がほぼ等しい場合、モデルは 2 つのグループを区別するパターンを見つける可能性が高くなります。 このような場合にバランス・ノードを使用して、低 の結果を含むケースを減らすバランス式を作成します。
バランスの調整で実際に行われるのは、指定の条件に従ったレコードの複製と破棄です。 適用する条件がないレコードは、すべて通過します。 この処理はレコードの複製と破棄から成り立っているため、下流の操作では元のデータ・シーケンスが失われます。 データ・ストリームにバランス・ノードを追加する前に、シーケンスに関連する値を必ず作成しておきます。