Go back to the English version of the documentation电信客户分类
电信客户分类
Last updated: 2024年12月11日
本教程将建立逻辑回归模型,这是一种根据输入字段值对记录进行分类的统计技术。 这种技术与线性回归类似,但用分类目标字段代替了数字字段。
例如,假设一家电信运营商按服务使用模式对客户群进行了细分,将客户分为四类。 如果人口统计数据可用于预测组成员资格,那么您可以为各个潜在客户定制报价。
试用教程
在本教程中,您将完成这些任务:
建模流程和数据集样本
本教程使用示例项目中的电信客户分类流程。 使用的数据文件是telco.csv。 下图显示了建模流程示例。
下图显示了该建模流程所使用的数据集。
本示例主要讲述使用人口统计数据预测使用情况模式。 目标字段
custcat
具有四个与四个客户组对应的可能值,如下所示:值 | 标签 |
---|---|
1 | 基本服务 |
2 | 电子服务 |
3 | 增值服务 |
4 | 全套服务 |
由于目标具有多个类别,因此将使用多项模型。 如果目标有两个截然不同的类别,如是/否、真/假或流失/不流失,则可以创建一个二项模型。
任务 1:打开示例项目
任务 2:检查数据资产、类型和筛选器节点
电信客户分类建模流程包括几个节点。 按照以下步骤检查其中的三个节点:
- 从 "资产"选项卡,打开 "电信客户分类"建模流程,等待加载画布。
- 双击telco.csv节点。 该节点是数据资产节点,指向项目中的telco.csv文件。
- 查看文件格式属性。
- 可选:单击 "预览数据"查看完整数据集。
- 双击类型节点,然后单击读取值。 该节点指定字段属性,如测量级别(字段包含的数据类型),以及每个字段在建模中作为目标或输入的作用。 确保所有测量级别设置正确。 例如,值为
0.0
和1.0
的大多数字段可被视为标志。gender
看作是一个有两个值的字段,而不是一个标志,因此将其测量值保留为 "标称值 "更为正确。 - 将
custcat
字段的角色设置为目标。 所有其他字段的角色仍设置为输入。 - 双击过滤器节点,查看其属性。
- 请注意,该节点只筛选出相关字段:'
region
, 'age
, 'marital
, 'address
, 'income
, 'ed
, 'employ
, 'retire
, 'gender
, 'reside
和 'custcat
)。 本分析不包括其他字段。
检查您的进度
下图显示了过滤器节点。 现在您可以查看Logistic节点了。
任务 3:查看逻辑节点
请按照以下步骤使用多项式逻辑回归对客户进行分类:
- 双击custcat (Logistic)节点,查看其属性。
- 在模型设置部分,选择多项式程序。
- 当目标字段是具有两个离散值的标志字段或名义字段时,就会使用二项式模型。
- 当目标字段是一个具有两个以上值的名义字段时,就会使用多项式模型。
- 然后,选择逐步 法和主效应模型类型。 同时,选择 "在方程中包含常数"复选框。
- 在专家选项部分,选择专家模式。
- 单击输出。 选择分类表,然后单击确定。
检查您的进度
下图显示了Logistic节点。 现在您可以浏览模型了。
任务 4:浏览模型
请按照以下步骤浏览模型:
- 将鼠标悬停在custcat(物流)节点上,然后点击运行图标 "。
- 在 "输出和模型"窗格中,单击custcat模型查看结果。
然后,您可以探查模型信息、功能部件(预测变量)重要性和参数估计信息。
这些结果仅基于训练数据。 要评估模型对现实世界中其他数据的泛化程度,可以使用分区节点来保留记录子集,以便进行测试和验证。
检查您的进度
目录
此示例向您展示了如何使用人口统计数据来预测使用模式,方法是建立一个逻辑回归模型,根据输入字段值对记录进行分类。
后续步骤
现在您可以尝试其他SPSS® Modeler教程了。