SQL プッシュバックがサポートされているノード

最終更新: 2025年4月15日
SQL の最適化 (SPSS Modeler)

以下の表は、SQLプッシュバックをサポートするデータマイニングオペレーションを表すノードを示している。 以下の表に記載されていないノードについては、SQL プッシュバックはサポートされていません。

表 1. レコード設定ノード
SQL 生成をサポートしているノード メモ
選択 選択式自体の SQL 生成がサポートされている場合のみ、生成をサポートします。 いずれかのフィールドにヌルが含まれている場合、SQL 生成では、ネイティブ SPSS Modelerで指定されているものと同じ破棄の結果は得られません。
サンプル 単純なサンプリングは、データベースに応じたさまざまな度合いで SQL 生成をサポートします。
集計 グループ集計の SQL 生成サポートは、データ・ストレージ・タイプによって異なります。
RFM 集計 2 番目または 3 番目に最近のトランザクションの日付を保存する場合を除いて、または最新のトランザクションを含む場合のみ生成をサポートします。 ただし、datetime_date(YEAR,MONTH,DAY) 関数がプッシュバックされる場合は、最新のトランザクションを含んでも機能しません。
ソート  
マージ 順序によるレコード結合では、SQL 生成はサポートされません。

完全外部結合または部分外部結合のキーによる結合は、データベース/ドライバーがサポートしている場合にのみ対応しています。 一致しない入力フィールドの名前は、FilterノードまたはインポートノードのFilter設定を使用して変更できます。

条件による結合の SQL 生成をサポートしています。

すべての結合のタイプで、入力が異なるデータベースで作成される場合は、SQL_SP_EXISTS はサポートされていません。

追加 入力がソートされていない場合のみ生成がサポートされます。 SQL 最適化は、入力の列数が同じ場合にのみ実行できます。
重複レコード (デフォルト) モードの「各グループの複合レコードを作成」が選択されている重複レコード・ノードは、SQL 最適化をサポートしません。
表 2. 簡単なサンプリングのサンプリング・ノードの SQL 生成のサポート
モード サンプル 最大サイズ シード Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
含める 最初 該当なし   Y Y Y Y Y Y
  n 件ごと オフ   Y Y Y Y   Y
    最大   Y Y Y Y   Y
  ランダム% オフ オフ Y   Y Y   Y
      オン Y   Y Y    
    最大 オフ Y   Y Y   Y
      オン Y   Y Y    
破棄 最初 オフ         Y    
    最大         Y    
  n 件ごと オフ   Y Y Y Y   Y
    最大   Y Y Y Y   Y
  ランダム% オフ オフ Y   Y Y   Y
      オン Y   Y Y    
    最大 オフ Y   Y Y   Y
      オン Y   Y Y    
表 3. レコード集計ノードの SQL 生成サポート
ストレージ 合計 平均値 最小 最大 標準偏差 中央値 差異 パーセンタイル
整数 Y Y Y Y Y Y* Y Y Y*
実数 Y Y Y Y Y Y* Y Y Y*
日付     Y Y   Y* Y   Y*
時刻     Y Y   Y* Y   Y*
タイム・スタンプ     Y Y   Y* Y   Y*
ストリング     Y Y   Y* Y   Y*

* 中央値とパーセンタイルは Oracle でサポートされています。

表 4。 フィールド設定ノード
SQL 生成をサポートしているノード メモ
タイプ SQL 生成は、Type ノードがインスタンス化され、 ABORT または WARN タイプ・チェックが指定されていない場合にのみサポートされます。
フィルター  
導出

SQL 生成は、derive 式から生成された SQL が有効である場合にのみサポートされます。

ただし、 SPSS ModelerDerive as オプションで State または Count を選択した場合、SQL を生成できません。

  • STATEは、SQLが本来扱わない永続的な状態追跡に依存しているため、SQLに変換することはできない。
  • COUNTは実行中の合計を維持する必要があるが、標準SQLではこれもサポートしていない。
アンサンブル 連続型対象の SQL 生成をサポートしています。 その他の対象の場合は、「最高確信度勝ち取り」アンサンブル方法が使用されている場合にのみ、生成をサポートします。
充てん文字 SQL生成は、derive式から生成されたSQLが有効である場合にサポートされます。
匿名化 連続型対象の SQL 生成、名義型、フラグ型対象の部分的 SQL 生成をサポートしています。
再分類  
データ分割 SQL 生成は、 Tiles (equal count) binning method が使用され、 Read from Bin Values tab if available オプションが選択されている場合にサポートされます。 ビン境界の計算方法の違いにより (この違いはビン フィールド内のデータの分布の性質が原因)、通常のフローの実行結果と SQL プッシュバックの結果を比較する際に、データ分割出力に差異が表れる場合があります。 これを避けるには、「レコード件数」分位方法と、「隣のビンへ追加」または「現在のまま保持」の分位のいずれかを使用して、フロー実行の 2 つの方式の間で最も近い一致を取得します。
RFM 分析 SQL 生成は、 使用可能な場合はビン値タブから読み取るオプションが選択されている場合にサポートされますが、下流ノードではサポートされません。
パーティション SQL 生成をサポートしてレコードをデータ区分に割り当てる :
フラグ設定  
再構成  
表 5. グラフ・ノード
SQL 生成をサポートしているノード メモ
配布  
ウェブ  
評価  

一部のモデルについて、モデル・ナゲットの SQL を生成し、モデルのスコアリング段階をデータベースにプッシュ バックします。 この機能の主な使用はパフォーマンスの改善でなく、これらのナゲットを含むフローがすべての SQL をプッシュバックできるようにするためです。 詳細については、 モデル・ナゲットからSQLを生成するを参照してください。

表 6. モデル・ナゲット
SQL 生成をサポートしているモデル・ナゲット メモ
C&R ツリー 単一ツリー・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
QUEST  
カイ 2 乗自動反復検出アルゴリズム  
C5.0  
ディシジョン・リスト  
線形 標準モデル・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
ニューラル・ネットワーク 標準モデル・オプションの SQL 生成はサポートしますが (多層パーセプトロンのみ)、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
PCA/因子分析  
ロジスティック 多項式手続きの SQL 生成をサポートしていますが、2 項式ではサポートされていません。 多項式の場合、確信度が選択されている場合、対象の種類がフラグ型でない限り生成はサポートされません。
生成されたルールセット  
自動分類 ユーザー定義関数 (UDF) スコアリング アダプターが使用可能な場合、これらのナゲットは SQL プッシュバックをサポートします。 また、連続型ターゲットの SQL 生成または「最高確信度勝ち取り」アンサンブル法を使用した場合、さらに下流でのプッシュバックがこれらのナゲットでサポートされます。
自動数値
表 7. 出力ノード
SQL 生成をサポートしているノード メモ
強調表示式で SQL 生成がサポートされている場合に生成をサポートします。
行列(M) フィールド・オプションで「すべての数値」が選択されている場合を除いて、生成がサポートされています。
解析 選択されているオプションに応じて、生成をサポートします。
変換  
統計 「相関関係」オプションが使用されていない場合、生成をサポートします。
報告書  
グローバルの設定