0 / 0
資料の 英語版 に戻る
電気通信の顧客を分類する
最終更新: 2024年12月11日
電気通信の顧客を分類する

このチュートリアルでは、入力フィールドの値に基づいてレコードを分類する統計手法であるロジスティック回帰モデルを構築します。 線型と似ていますが、数値型対象フィールドではなくカテゴリー対象フィールドを取ります。

たとえば、ある電気通信事業者が、顧客ベースをサービス利用パターンでセグメント化し、顧客を4つのグループに分類したとする。 人口統計データを使用して顧客がどのグループに所属するかを予測できれば、個々の見込み客にあわせてサービスをカスタマイズすることができます。

チュートリアルを試す

このチュートリアルでは、以下のタスクを実行します:

モデラーのフローとデータセットのサンプル

このチュートリアルでは、サンプル・プロジェクトのClassifying Telecommunications Customerフローを使用します。 使用するデータファイルはtelco.csvである。 次の図は、モデラーのフロー例を示しています。

図1: サンプルモデラーの流れ
サンプルモデラーの流れ

次の画像は、このモデラーフローで使用されるデータセットである。

図2: サンプルデータセット
サンプルデータセット
この例は、使用パターンを予測するための人口統計データの使用方法に注目します。 以下のように、対象フィールド custcat には、4 つの顧客グループに対応する 4 つの可能な値があります。
表 1. 対象フィールドの可能値
ラベル
1 基本サービス
2 E-サービス
3 プラス・サービス
4 トータル・サービス

対象に複数のカテゴリーがあるために、多項モデルを使用します。 対象が、はい/いいえ、真/偽、解約する/しないのような2つの異なるカテゴリーを持つ場合、代わりに2項モデルが作成されるかもしれない。

タスク 1:サンプルプロジェクトを開く

サンプル・プロジェクトには、いくつかのデータ・セットとモデラー・フローのサンプルが含まれています。 サンプル・プロジェクトをまだお持ちでない場合は、チュートリアル・トピックを参照してサンプル・プロジェクトを作成してください。 次に、以下の手順でサンプルプロジェクトを開きます:

  1. Cloud Pak for Dataナビゲーションメニューナビゲーション・メニュー」から、Projects > View all Projetsをc選択します。
  2. SPSS ModelerProjectをクリックします。
  3. アセット」タブをクリックすると、データセットとモデラーフローが表示されます。

チェックポイントのアイコン進捗状況を確認する

次の図は、プロジェクトのAssetsタブを示しています。 これで、このチュートリアルに関連するサンプルモデラーフローで作業する準備ができました。

サンプル・プロジェクト

先頭に戻る

タスク 2: データ資産、タイプ、およびフィルタのノードを調べる

Classifying Telecommunication Customersモデラーのフローにはいくつかのノードがあります。 以下の手順に従って、3つのノードを調べる:

  1. Assetsタブから、Classifying Telecommunication Customersモデラー・フローを開き、キャンバスがロードされるのを待ちます。
  2. telco.csvノードをダブルクリックする。 このノードは、プロジェクト内のtelco.csvファイルを指すData Assetノードです。
  3. ファイル形式のプロパティを確認します。
  4. オプション:完全なデータセットを表示するには、データのプレビューをクリックします。
  5. Typeノードをダブルクリックし、Read Valuesをクリックする。 このノードは、測定レベル(フィールドが含むデータのタイプ)などのフィールド・プロパティや、モデリングにおけるターゲットまたは入力としての各フィールドの役割を指定する。 すべての測定レベルが正しく設定されていることを確認する。 例えば、0.0 および 1.0 の値を持つほとんどのフィールドはフラグ型と見なすことができます。
    図3: 尺度
    タイプ ノード、測定レベル

    genderは'公称 フラグではなく'フィールドであり、2つの値がセットになっている。
  6. custcat」フィールドの役割を「対象」に設定します。 その他のすべてのフィールドの役割は「入力」のままにします。
  7. Filterノードをダブルクリックしてプロパティを表示します。
  8. このノードは、関連するフィールド('region、'age、'marital、'address、'income、'ed、'employ、'retire、'gender、'reside、'custcat)だけをフィルタリングすることに注意。 この分析では、その他の分野は除外している。

チェックポイントのアイコン進捗状況を確認する

次の図はFilterノードを示している。 これでロジスティック・ノードを表示する準備ができました。

フィルター・ノード

先頭に戻る

タスク3:ロジスティック・ノードの表示

多項ロジスティック回帰を使用して顧客を分類するには、以下の手順に従ってください:

  1. custcat (Logistic)ノードをダブルクリックしてプロパティを見る。
  2. モデル設定セクションで、多項式手順を選択する。
    • 二項モデルは、対象フィールドが2つの離散値を持つフラグフィールドまたはノミナルフィールドである場合に使用される。
    • 多項モデルは、対象フィールドが2つ以上の値を持つ名義フィールドである場合に使用される。
  3. 次に、ステップワイズ法と主効果モデルタイプを選択します。 また、方程式に定数を含めるチェックボックスを選択します。
    図4: ロジスティック・ノード・モデルの設定
    ロジスティック・ノード・モデルの設定
  4. Expert Optionsセクションで、Expertモードを選択する。
  5. 出力をクリックする。 分類表を選択し、OKをクリックする。
    図 5. ロジスティック・ノード 出力オプション
    ロジスティック・ノード 出力オプション

チェックポイントのアイコン進捗状況を確認する

次の図はLogisticノードを示しています。 これでモデルをブラウズする準備が整いました。

ロジスティック回帰ノード

先頭に戻る

タスク4:モデルのブラウズ

以下の手順に従ってモデルをブラウズしてください:

  1. custcat(ロジスティック)ノードにカーソルを合わせ、実行アイコン「実行アイコン」をクリックする。
  2. Outputs and models(出力とモデル)ペインで、custcatモデルをクリックして結果を表示する。
    図 6. モデルの特徴 重要度チャート
    モデルの特徴 重要度チャート

その後、モデル情報、特徴量 (予測値) の重要度、およびパラメーター推定値情報を検討できます。

これらの結果はトレーニングデータのみに基づいている。 モデルが実世界の他のデータにどの程度一般化されるかを評価するために、Partitionノードを使用して、テストと検証の目的でレコードのサブセットを保持することができます。

チェックポイントのアイコン進捗状況を確認する

先頭に戻る

サマリー

この例では、入力フィールドの値に基づいてレコードを分類するロジスティック回帰モデルを構築することで、人口統計データを使用して利用パターンを予測する方法を示しました。

次のステップ

これで、他のSPSS® Modelerチュートリアルを試す準備ができました。

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細