Go back to the English version of the documentation“派生”节点
"派生" 节点 (SPSS Modeler)
Last updated: 2024年11月22日
watsonx.ai Studio最强大的功能之一是修改数据值和从现有数据中导出新字段的能力。 在漫长的数据挖掘工程中,执行若干派生操作是很常见的,如从 Web 日志数据的字符串中抽取客户标识,或根据事务和人口统计数据创建客户生命周期值。 所有这些变换均可使用各种字段操作节点完成。
若干节点可提供派生新字段的功能:
- 派生节点修改数据值或者根据一个或多个现有字段创建新字段。 它可创建的字段类型包括公式、标志、名义、状态、计数和条件。
- 重新分类节点可将一组分类值转换为另一组值。 对于压缩类别或为分析而进行的数据重新分组,重新分类非常有用。
- 分级节点根据一个或多个现有连续(数值范围)字段的值自动创建新的名义(集合)字段。 例如,用户可将连续收入字段转换为一个包含各组收入的新的分类字段,作为其与平均值之间的偏差。 为新字段创建分箱后,可以根据分割点生成 "派生" 节点。
- 设为标志节点根据为一个或多个名义字段定义的分类值派生多个标志字段。
- 重构节点将名义字段或标志字段转换为一组字段,这组字段可以使用另一字段的值进行填充。 例如,给定名为
payment type
的字段 (值为credit
,cash
和debit
) ,将创建三个新字段 (credit
,cash
和debit
) ,每个新字段可能包含实际支付的值。
使用派生节点
使用派生节点,可以根据一个或多个现有字段创建六种类型的新字段:
- 公式。 新字段是任意 CLEM 表达式的结果。
- 标志。 新字段是代表指定条件的标志。
- 名义。 新字段是名义的,表示其成员是一组指定值。
- 状态。 新字段是两种状态之一。 通过指定条件触发这两种状态之间的切换。
- 计数。 新字段以满足某个条件的次数为基准。
- 条件。 新字段是两个表达式的其中一个的值,具体取决于条件的值。
其中每个节点都包含一组特殊选项。 这些选项将在后续主题中进行论述。
请注意,使用以下各项可能会更改行顺序:
- 通过 SQL 回送在数据库中执行
- 通过远程 Analytic Server 执行
- 使用在嵌入式 Analytic Server 中运行的函数
- 派生列表
- 调用空间函数
提示: "用于表达式处理的控制语言" (CLEM) 是一个功能强大的工具,可用于分析和处理流中使用的数据。 例如,可以在节点中使用 CLEM 来派生值。 有关更多信息,请参阅 CLEM (legacy) 语言参考。