0 / 0
資料の 英語版 に戻る
ロジスティック回帰ノード
最終更新: 2024年11月22日
ロジスティック回帰ノード (SPSS Modeler)

ロジスティック回帰 (名義回帰) は、入力フィールドの値に基づいてレコードを分類する統計手法です。 線型と似ていますが、数値型フィールドではなくカテゴリー・フィールドを対象フィールドとします。 二項モデル (2 つの異なるカテゴリーがある対象用) と多項モデル (3 つ以上のカテゴリーのある対象用) の両方がサポートされます。

ロジスティック回帰では、入力フィールド値を各出力フィールド カテゴリーに対応する確率に関連付ける一連の方程式が作成されます。 モデルが生成された後、そのモデルを使用して、新規データの確率を推定できます。 レコードごとに、各出力カテゴリー候補の所属確率が算出されます。 最も確率の高い対象カテゴリーが、そのレコードの予測出力値として割り当てられます。

2 項の例。 通信通信プロバイダーは、競合他社に奪われている顧客の数を懸念しています。 サービス使用量データを使用して、二項モデルを作成し、どの顧客が他のプロバイダーに移りそうかを予測できれば、オファーをカスタマイズして、できるだけ多くの顧客を保持することができます。 ターゲットに 2 つの異なるカテゴリー ( 転送または非転送など) があるため、二項モデルが使用されます。

注: 2 項モデルの場合のみ、文字列フィールドは 8 文字に制限されます。 必要な場合は、データ分類ノードまたは匿名化ノードを使用して、これより長い文字列を再コード化できます。

多項の例: ある通信プロバイダーは、サービス利用パターンによって顧客ベースを区分し、顧客を 4 つのグループに分類しました。 デモグラフィック・データを使用してグループ・メンバーシップを予測することで、多項モデルを作成して顧客をグループに分類し、それぞれの顧客に対してオファーをカスタマイズすることができます。

要件。 1 つ以上の入力フィールドと、2 つ以上のカテゴリーを含む 1 つのカテゴリー対象フィールドが必要です。 2 項モデルの場合、対象の尺度は Flagでなければなりません。 多項モデルの場合、対象の尺度は Flag、または 2 つ以上のカテゴリを持つ Nominal にすることができます。 Both または None に設定されたフィールドは無視されます。 モデルで使用するフィールド・タイプは、完全にインスタンス化する必要があります。

利点 たいていの場合、ロジスティック回帰モデルは非常に正確です。 ロジスティック回帰モデルでは、シンボル値と数値の入力フィールドを処理できます。 すべての対象カテゴリーに対する予測確率が算出されるため、「次善の推量」を簡単に識別することができます。 ロジスティック・モデルは、グループ・メンバーが真にカテゴリー的なフィールドの場合に最も効果的です。グループ・メンバーが連続した値の範囲の値 (例えば、「高い IQ」対「低い IQ」) に基づいている場合、値の範囲全体から提供されるより豊富な情報を活かすために、線型の使用を考慮する必要があります。 ロジスティック・モデルでは、自動的なフィールド選択も実行できます。ただし、ツリー・モデルや特徴量選択モデルなどの他のアプローチのほうが大規模データ・セットでは迅速に実行できます。 最後に、ロジスティック・モデルは多くのアナリストやデータ・マイニング技術者によく理解されているので、他のモデル作成技法に対する基準として、比較の対象に使用されることがあります。

大きなデータセットを処理する場合、詳細出力オプションの「尤度比検定」を無効にすることにより、パフォーマンスを大幅に改善することができます。

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細