Go back to the English version of the documentation树-AS 节点
Tree-AS 节点 (SPSS Modeler)
Last updated: 2024年11月22日
“树 AS”节点可以与分布式环境中的数据配合使用。 在此节点中,您可以使用 CHAID 或 Exhaustive CHAID 模型来构建决策树。
CHAID 或卡方自动交互检测是一种通过使用卡方统计量识别最优分割来构建决策树的分类方法。
CHAID 首先检查每个输入字段和结果之间的交叉表,然后使用卡方独立性检验来检验显著性。 如果以上多个关系具有显著的统计意义,那么 CHAID 将选择最重要(p
值最小)的输入字段。 如果输入具有两个以上的类别,那么将会对这些类别进行比较,然后将结果中未显示出差异的类别合并在一起。 此操作通过将显示的显著性差异最低的类别对相继合并在一起来实现。 当所有剩余类别在指定的检验级别上存在差异时,此类别合并过程将终止。 对于名义输入字段,可以合并任何类别;对于有序集合,只能合并相邻的类别。
Exhaustive CHAID 是 CHAID 的修正版,它可对每个预测变量的所有可能分割进行更彻底的检查,但计算时间比较长。
需求。 目标和输入字段可以是连续字段,也可以是分类字段;节点在每一层上都可以分割为两个或多个子组。 模型中使用的所有顺序字段的存储类型都必须是数字类型(不是字符串)。 必要的话,可以使用重新分类节点来对其进行转换。
强度。 CHAID 可以生成非二元树,这意味着有些分割将有多于两个的分支。 因此,与二元生成方法相比,CHAID 倾向于创建范围更广的树。 CHAID 适用于所有类型的输入,并且接受观测值权重和频率变量。