0 / 0
資料の 英語版 に戻る
レコード集計ノード
最終更新: 2024年10月07日
集約ノード (SPSS Modeler)

レコード集計は、データ・セットのサイズを減らすために頻繁に用いられるデータ準備作業です。 レコード集計を行う前に、データのクリーニングを、特に欠損値に注目して行う必要があります。 集計で、欠損値に関する潜在的に有用な情報が失われる可能性があります。

レコード集計ノードを使用すると、一連の入力レコードを要約 (集計された出力レコード) に置き換えることができます。 例えば、 次の表に示すような一連の入力売上レコードがあるとします。

表 1. 売上レコード入力の例
Age Sex (性別) リージョン ブランチ Sales (販売額)
23 M S 8 4
45 M S 16 4
37 M S 8 5
30時間まで M S 5 7
44 M N 4 9
25 GB M N 2 11
29 F S 16 6
41 F N 4 8
23 F N 6 2
45 F N 4 5
33 F N 6 10

上記のレコードを、SexRegion をキー・フィールドにして集計することができます。 次に、 Age をモード 「平均」 で集約し、 Sales をモード 「合計」で集約することを選択します。 「フィールドにレコード・カウントを含める」集計ノード・オプションを選択すると、集計後の出力が以下の表のようになります。

表 2. 集計したレコードの例
Age (平均年齢) Sex (性別) リージョン Sales (販売額) レコード件数
35.5 F N 25 GB 4
29 F S 6 1
34.5 M N 20 2
33.75 M S 20 4

例えば、このことから、北部地域の 4 名の女性販売スタッフの平均年齢が 35.5 歳で、合計販売金額が 25 単位です。

注: 集約モードが指定されていない場合、 Branch などのフィールドは自動的に破棄されます。
生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細