"表达式操作的控制语言" (CLEM) 是一种功能强大的语言,用于分析和处理流经 SPSS Modeler 流的数据。 数据挖掘人员可在流操作中广泛使用 CLEM 来执行根据成本和收入数据推导利润这样的简单任务,也可以执行将 Web 日志数据转换为具有有用信息的一系列字段和记录这样的复杂任务。
CLEM 在 SPSS Modeler 中用于:
- 比较和评估记录字段上的条件
- 派生新字段的值
- 派生现有字段的新值
- 记录序列的原因
- 将记录中的数据插入到报告中
CLEM 表达式对于 SPSS Modeler 中的数据准备是不可或缺的,可以在广泛的节点中使用,从记录和字段操作 (Select , Balance , Filler) 到图和输出 (Analysis , Report , Table)。 例如,您可以在 "派生" 节点中使用 CLEM 来根据公式 (例如,比率) 创建新字段。
CLEM 表达式还可用于全局搜索和替换操作。 例如,表达式 @NULL(@FIELD)
可以在 Filler 节点中用于将 系统缺失值 替换为整数值 0。 (要替换 用户缺失值(也称为空白) ,请使用 @BLANK
函数。)
还可以创建更复杂的 CLEM 表达式。 例如,您可以根据一组条件规则 (例如,使用以下表达式创建的新值类别) 派生新字段: If: CardID = @OFFSET(CardID,1), Then: @OFFSET(ValueCategory,1), Else:
'exclude'
。
此示例使用 @OFFSET
函数来表示: 如果给定记录的字段 CardID 的值与先前记录的值相同,那么返回先前记录的名为 ValueCategory 的字段的值。 否则,将为其赋予字符串“exclude”。 换言之,如果邻近记录的 CardID 值相同,就应该赋予它们相同的 ValueCategory。 (带有字符串“exclude”的记录可在稍后通过选择节点调用。)