Go back to the English version of the documentation“分区”节点
分区节点 (SPSS Modeler)
Last updated: 2024年11月22日
“分区”节点用于生成分区字段,将数据分割为单独的子集或样本,以供模型构建的训练、测试和验证阶段使用。 通过用某个样本生成模型并用另一个样本对模型进行测试,可以预判此模型对类似于当前数据的大型数据集的拟合优劣。
分区节点会生成名义字段,其角色设置为分区。 此外,如果数据中已经存在相应的字段,可以使用“类型”节点将其指定为分区。 在这种情况下,不需要单独的“分区”节点。 可以将任何具有两个或三个值的实例化名义字段用作分区,但不能使用标志字段。
可以在一个流中定义多个分区字段,但如果这么做,那么必须在每个使用分区的建模节点中选择一个分区字段。 (如果仅有一个分区字段,则将在启用分区后自动引入此字段。)
要基于其他标准(如数据范围或位置)创建分区字段,还可以使用“派生”节点。 有关更多信息,请参阅 "派生" 节点 。
示例。 构建 RFM 流以识别积极响应以往营销活动的最新客户时,销售公司的市场营销部可以使用“分区”节点将数据分割到训练分区和检验分区。