資料の 英語版 に戻る欠損値の処理
欠損値の処理 (SPSS Modeler)
最終更新: 2024年10月04日
業務やドメインの知識の観点から、欠損値をどのように取り扱うかを決定する必要があります。 多くの場合、学習時間を短縮し、精度を向上させるには、データセットから空白を削除する必要があります。 その一方で、空白値から、新しいビジネス・チャンスを発見したり、新規の洞察を加えられることもあります。
最適テクニックを選択するときに、次に示すデータの側面を検討する必要があります。
- データ・セットのサイズ
- 空白を含むフィールドの数
- 失われた情報の量
一般的に、アプローチは次の 2 通りあります。
- 欠損値を含むフィールドまたはレコードを除外する。
- 様々な方法で欠損値を代入、置換または強制する。