0 / 0
Go back to the English version of the documentation
电信客户分类
Last updated: 2024年12月11日
电信客户分类

本教程将建立逻辑回归模型,这是一种根据输入字段值对记录进行分类的统计技术。 这种技术与线性回归类似,但用分类目标字段代替了数字字段。

例如,假设一家电信运营商按服务使用模式对客户群进行了细分,将客户分为四类。 如果人口统计数据可用于预测组成员资格,那么您可以为各个潜在客户定制报价。

试用教程

在本教程中,您将完成这些任务:

建模流程和数据集样本

本教程使用示例项目中的电信客户分类流程。 使用的数据文件是telco.csv。 下图显示了建模流程示例。

图 1。 样品建模流程
样品建模流程

下图显示了该建模流程所使用的数据集。

图 2。 样本数据集
样本数据集
本示例主要讲述使用人口统计数据预测使用情况模式。 目标字段 custcat 具有四个与四个客户组对应的可能值,如下所示:
表 1. 目标字段的可能值
标签
1 基本服务
2 电子服务
3 增值服务
4 全套服务

由于目标具有多个类别,因此将使用多项模型。 如果目标有两个截然不同的类别,如是/否、真/假或流失/不流失,则可以创建一个二项模型。

任务 1:打开示例项目

示例项目包含多个数据集和示例建模流程。 如果还没有示例项目,请参阅教程主题创建示例项目。 然后按照以下步骤打开示例项目:

  1. Cloud Pak for Data 中,从导航菜单"导航菜单,选择项目 > 查看所有项目
  2. 单击SPSS ModelerProject
  3. 单击 "资产"选项卡,查看数据集和建模流程。

检查点图标检查您的进度

下图显示了 "项目资产 "选项卡。 现在您可以使用与本教程相关的示例建模流程了。

样本项目

返回到顶部

任务 2:检查数据资产、类型和筛选器节点

电信客户分类建模流程包括几个节点。 按照以下步骤检查其中的三个节点:

  1. 从 "资产"选项卡,打开 "电信客户分类"建模流程,等待加载画布。
  2. 双击telco.csv节点。 该节点是数据资产节点,指向项目中的telco.csv文件。
  3. 查看文件格式属性
  4. 可选:单击 "预览数据"查看完整数据集。
  5. 双击类型节点,然后单击读取值。 该节点指定字段属性,如测量级别(字段包含的数据类型),以及每个字段在建模中作为目标或输入的作用。 确保所有测量级别设置正确。 例如,值为 0.01.0 的大多数字段可被视为标志。
    图 3。 测量级别
    节点类型,测量级别

    请注意,将 "gender看作是一个有两个值的字段,而不是一个标志,因此将其测量值保留为 "标称值 "更为正确。
  6. custcat 字段的角色设置为目标。 所有其他字段的角色仍设置为输入
  7. 双击过滤器节点,查看其属性。
  8. 请注意,该节点只筛选出相关字段:'region, 'age, 'marital, 'address, 'income, 'ed, 'employ, 'retire, 'gender, 'reside 和 'custcat)。 本分析不包括其他字段。

检查点图标检查您的进度

下图显示了过滤器节点。 现在您可以查看Logistic节点了。

过滤节点

返回到顶部

任务 3:查看逻辑节点

请按照以下步骤使用多项式逻辑回归对客户进行分类:

  1. 双击custcat (Logistic)节点,查看其属性。
  2. 模型设置部分,选择多项式程序。
    • 当目标字段是具有两个离散值的标志字段或名义字段时,就会使用二项式模型。
    • 当目标字段是一个具有两个以上值的名义字段时,就会使用多项式模型。
  3. 然后,选择逐步 法和主效应模型类型。 同时,选择 "在方程中包含常数"复选框。
    图 4: 逻辑节点模型设置
    逻辑节点模型设置
  4. 专家选项部分,选择专家模式。
  5. 单击输出。 选择分类表,然后单击确定
    图 5. 逻辑节点 输出选项
    逻辑节点 输出选项

检查点图标检查您的进度

下图显示了Logistic节点。 现在您可以浏览模型了。

Logistic 节点

返回到顶部

任务 4:浏览模型

请按照以下步骤浏览模型:

  1. 将鼠标悬停在custcat(物流)节点上,然后点击运行图标 "运行图标
  2. 在 "输出和模型"窗格中,单击custcat模型查看结果。
    图 6. 模型特征重要性图表
    模型特征重要性图表

然后,您可以探查模型信息、功能部件(预测变量)重要性和参数估计信息。

这些结果仅基于训练数据。 要评估模型对现实世界中其他数据的泛化程度,可以使用分区节点来保留记录子集,以便进行测试和验证。

检查点图标检查您的进度

返回到顶部

目录

此示例向您展示了如何使用人口统计数据来预测使用模式,方法是建立一个逻辑回归模型,根据输入字段值对记录进行分类。

后续步骤

现在您可以尝试其他SPSS® Modeler教程了

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more