Go back to the English version of the documentation支持 SQL 回送的节点
SQL 优化 (SPSS Modeler)
Last updated: 2024年10月07日
此部分中的表显示表示支持 SQL 回送的数据挖掘操作的节点。 如果节点未显示在这些表中,则不支持 SQL 回送。
支持 SQL 生成的节点 | 注意 |
---|---|
选择 | 仅当支持选择表达式本身的 SQL 生成时,才支持生成。 如果任何字段具有空值,那么 SQL 生成不会给出与本机 SPSS Modeler中给出的废弃结果相同的结果。 |
样本 | 根据数据库不同,简单采样在各种程度上支持 SQL 生成。 |
汇总 | 对汇总的 SQL 生成支持依赖于数据存储类型。 |
RFM 汇总 | 支持生成,除非保存了第二个或第三个最近交易的日期,或仅仅包含最近的几次交易。 但是,如果回送 datetime_date(YEAR,MONTH,DAY) 函数,那么包含最近的事务将生效。 |
Sort | |
合并 | 对于按顺序合并,不会生成任何 SQL。 仅当数据库/驱动程序支持具有完全或部分外连接的按键合并时,才支持此功能。 可通过“过滤”节点或导入节点的“过滤”设置重命名非匹配的输入字段。 支持按条件合并的 SQL 生成。 对于所有类型的合并,如果输入源自不同的数据库,那么不支持 |
附加 | 如果输入未经排序,那么支持生成。 仅当您的输入拥有相同列数时,才有可能实现 SQL 优化。 |
区分 | 选择了(缺省)方式为每个组创建组合记录的“区分”节点不支持 SQL 优化。 |
方式 | 样本 | 大小最大值 | 种子 | Db2 for z/OS | Db2 for OS/400 | Db2 for Win/UNIX | Oracle | SQL Server | Teradata |
---|---|---|---|---|---|---|---|---|---|
包含 | 第一个 | 不适用 | Y | Y | Y | Y | Y | Y | |
n 中取 1 | 关 | Y | Y | Y | Y | Y | |||
max | Y | Y | Y | Y | Y | ||||
随机 % | 关 | 关 | Y | Y | Y | Y | |||
于 | Y | Y | Y | ||||||
max | 关 | Y | Y | Y | Y | ||||
于 | Y | Y | Y | ||||||
废弃 | 第一个 | 关 | Y | ||||||
max | Y | ||||||||
n 中取 1 | 关 | Y | Y | Y | Y | Y | |||
max | Y | Y | Y | Y | Y | ||||
随机 % | 关 | 关 | Y | Y | Y | Y | |||
于 | Y | Y | Y | ||||||
max | 关 | Y | Y | Y | Y | ||||
于 | Y | Y | Y |
存储器 | 总和 | 平均值 | 最小值 | 最大值 | 标准差 | 中位数 | 计数 | 方差 | 百分位 |
---|---|---|---|---|---|---|---|---|---|
整数 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
实数 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
日期 | Y | Y | Y* | Y | Y* | ||||
时间 | Y | Y | Y* | Y | Y* | ||||
时间戳记 | Y | Y | Y* | Y | Y* | ||||
字符串 | Y | Y | Y* | Y | Y* |
* 在 Oracle 上支持中值和百分位数。
支持 SQL 生成的节点 | 注意 |
---|---|
类型 | 如果“类型”节点已实例化并且未指定 ABORT 或 WARN 类型检查,那么支持 SQL 生成。 |
过滤 | |
派生 | 如果支持为派生表达式生成的 SQL ,那么支持 SQL 生成 (请参阅本页后面的表达式)。 |
整体 | 对于连续目标,支持 SQL 生成。 对于其他目标,仅当使用最高置信度当选整体方法时,才支持生成。 |
填充 | 如果支持为派生表达式生成的 SQL ,那么支持 SQL 生成。 |
匿名化 | 支持连续目标的 SQL 生成,以及名义和标志目标的部分 SQL 生成。 |
重新分类 | |
分级 | 如果使用分位数(同等计数)分级方法,并且选中了从‘分级值’选项卡读取(如果可用)选项,那么支持 SQL 生成。 由于分级边界的计算方式存在差异(这是由分级字段中的数据分布性质所造成),因此在比较一般流执行结果和 SQL 回送结果时,分级输出可能会有不同。 要避免此情况,请使用记录计数平铺方法,或者添加到下一个分级或在当前分级中保留平铺,以获取两种流执行方法之间最接近的匹配。 |
RFM 分析 | 如果选择从‘分级值’选项卡读取(如果可用)选项,则支持 SQL 生成,但下游节点不支持。 |
分区 | 支持 SQL 生成以分配记录到分区。 |
设为标志 | |
重建 |
支持 SQL 生成的节点 | 注意 |
---|---|
分布 | |
网络 | |
评估 |
对于某些模型,可以生成模型块的 SQL,从而将模型评分阶段回送到数据库。 此功能的主要用途不是提高性能,而是允许包含这些块的流将其完整的 SQL 回送。 请参阅 从模型块生成 SQL 以获取更多信息。
支持 SQL 生成的模型块 | 注意 |
---|---|
C&R 树 | 支持单个树选项的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。 |
QUEST | |
CHAID | |
C5.0 | |
决策列表 | |
线性 | 支持标准模型选项的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。 |
神经网络 | 支持标准模型选项(仅多层感知器)的 SQL 生成,但不支持推进、组装或大型数据集选项的 SQL 生成。 |
主成分分析/因子 | |
Logistic | 支持多项(而非二项)过程的 SQL 生成。 对于多项过程,选择置信度时,不支持生成,除非目标类型为“标志”。 |
生成的规则集 | |
自动分类器 | 如果启用了用户定义的函数 (UDF) 评分适配器,那么这些块支持 SQL 回送。 并且,如果为连续目标生成 SQL,或者使用了最高置信度当选整体方法,那么这些块支持进一步向下游回送。 |
自动数值 |
支持 SQL 生成的节点 | 注意 |
---|---|
表 | 如果针对突出显示表达式支持 SQL 生成,那么支持生成。 |
矩阵 | 除了选择了“字段”选项的所有数字外,都支持生成。 |
分析 | 支持生成,具体取决于选择的选项。 |
变换 | |
统计信息 | 如果未使用“相关”选项,那么支持生成。 |
报告 | |
设置全局量 |