0 / 0
Go back to the English version of the documentation
支持 SQL 回送的节点
Last updated: 2024年10月07日
SQL 优化 (SPSS Modeler)

此部分中的表显示表示支持 SQL 回送的数据挖掘操作的节点。 如果节点未显示在这些表中,则不支持 SQL 回送。

表 1. 记录操作节点
支持 SQL 生成的节点 注意
选择 仅当支持选择表达式本身的 SQL 生成时,才支持生成。 如果任何字段具有空值,那么 SQL 生成不会给出与本机 SPSS Modeler中给出的废弃结果相同的结果。
样本 根据数据库不同,简单采样在各种程度上支持 SQL 生成。
汇总 对汇总的 SQL 生成支持依赖于数据存储类型。
RFM 汇总 支持生成,除非保存了第二个或第三个最近交易的日期,或仅仅包含最近的几次交易。 但是,如果回送 datetime_date(YEAR,MONTH,DAY) 函数,那么包含最近的事务将生效。
Sort  
合并 对于按顺序合并,不会生成任何 SQL。

仅当数据库/驱动程序支持具有完全或部分外连接的按键合并时,才支持此功能。 可通过“过滤”节点或导入节点的“过滤”设置重命名非匹配的输入字段。

支持按条件合并的 SQL 生成。

对于所有类型的合并,如果输入源自不同的数据库,那么不支持 SQL_SP_EXISTS

附加 如果输入未经排序,那么支持生成。 仅当您的输入拥有相同列数时,才有可能实现 SQL 优化。
区分 选择了(缺省)方式为每个组创建组合记录的“区分”节点不支持 SQL 优化。
表 2. 在“样本”节点中支持 SQL 生成以用于简单采样
方式 样本 大小最大值 种子 Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
包含 第一个 不适用   Y Y Y Y Y Y
  n 中取 1   Y Y Y Y   Y
    max   Y Y Y Y   Y
  随机 % Y   Y Y   Y
      Y   Y Y    
    max Y   Y Y   Y
      Y   Y Y    
废弃 第一个         Y    
    max         Y    
  n 中取 1   Y Y Y Y   Y
    max   Y Y Y Y   Y
  随机 % Y   Y Y   Y
      Y   Y Y    
    max Y   Y Y   Y
      Y   Y Y    
表 3. 在“汇总”节点中支持 SQL 生成
存储器 总和 平均值 最小值 最大值 标准差 中位数 计数 方差 百分位
整数 Y Y Y Y Y Y* Y Y Y*
实数 Y Y Y Y Y Y* Y Y Y*
日期     Y Y   Y* Y   Y*
时间     Y Y   Y* Y   Y*
时间戳记     Y Y   Y* Y   Y*
字符串     Y Y   Y* Y   Y*

* 在 Oracle 上支持中值和百分位数。

表 4. 字段操作节点
支持 SQL 生成的节点 注意
类型 如果“类型”节点已实例化并且未指定 ABORTWARN 类型检查,那么支持 SQL 生成。
过滤  
派生 如果支持为派生表达式生成的 SQL ,那么支持 SQL 生成 (请参阅本页后面的表达式)。
整体 对于连续目标,支持 SQL 生成。 对于其他目标,仅当使用最高置信度当选整体方法时,才支持生成。
填充 如果支持为派生表达式生成的 SQL ,那么支持 SQL 生成。
匿名化 支持连续目标的 SQL 生成,以及名义和标志目标的部分 SQL 生成。
重新分类  
分级 如果使用分位数(同等计数)分级方法,并且选中了从‘分级值’选项卡读取(如果可用)选项,那么支持 SQL 生成。 由于分级边界的计算方式存在差异(这是由分级字段中的数据分布性质所造成),因此在比较一般流执行结果和 SQL 回送结果时,分级输出可能会有不同。 要避免此情况,请使用记录计数平铺方法,或者添加到下一个分级在当前分级中保留平铺,以获取两种流执行方法之间最接近的匹配。
RFM 分析 如果选择从‘分级值’选项卡读取(如果可用)选项,则支持 SQL 生成,但下游节点不支持。
分区 支持 SQL 生成以分配记录到分区。
设为标志  
重建  
表 5. 图形节点
支持 SQL 生成的节点 注意
分布  
网络  
评估  

对于某些模型,可以生成模型块的 SQL,从而将模型评分阶段回送到数据库。 此功能的主要用途不是提高性能,而是允许包含这些块的流将其完整的 SQL 回送。 请参阅 从模型块生成 SQL 以获取更多信息。

表 6. 模型块
支持 SQL 生成的模型块 注意
C&R 树 支持单个树选项的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。
QUEST  
CHAID  
C5.0  
决策列表  
线性 支持标准模型选项的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。
神经网络 支持标准模型选项(仅多层感知器)的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。
主成分分析/因子  
Logistic 支持多项(而非二项)过程的 SQL 生成。 对于多项过程,选择置信度时,不支持生成,除非目标类型为“标志”。
生成的规则集  
自动分类器 如果启用了用户定义的函数 (UDF) 评分适配器,那么这些块支持 SQL 回送。 并且,如果为连续目标生成 SQL,或者使用了最高置信度当选整体方法,那么这些块支持进一步向下游回送。
自动数值
表 7. 输出节点
支持 SQL 生成的节点 注意
如果针对突出显示表达式支持 SQL 生成,那么支持生成。
矩阵 除了选择了“字段”选项的所有数字外,都支持生成。
分析 支持生成,具体取决于选择的选项。
变换  
统计信息 如果未使用“相关”选项,那么支持生成。
报告  
设置全局量  
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more