0 / 0
資料の 英語版 に戻る
SQL プッシュバックがサポートされているノード
最終更新: 2025年2月12日
SQL の最適化 (SPSS Modeler)

このセクションでは、SQL プッシュバックがサポートされているノードを、データ・マイニング操作の説明とともに、表にまとめています。 以下の表に記載されていないノードについては、SQL プッシュバックはサポートされていません。

表 1. レコード設定ノード
SQL 生成をサポートしているノード ノート
選択 選択式自体の SQL 生成がサポートされている場合のみ、生成をサポートします。 いずれかのフィールドにヌルが含まれている場合、SQL 生成では、ネイティブ SPSS Modelerで指定されているものと同じ破棄の結果は得られません。
サンプル 単純なサンプリングは、データベースに応じたさまざまな度合いで SQL 生成をサポートします。
集計 グループ集計の SQL 生成サポートは、データ・ストレージ・タイプによって異なります。
RFM 集計 2 番目または 3 番目に最近のトランザクションの日付を保存する場合を除いて、または最新のトランザクションを含む場合のみ生成をサポートします。 ただし、datetime_date(YEAR,MONTH,DAY) 関数がプッシュバックされる場合は、最新のトランザクションを含んでも機能しません。
ソート  
マージ 順序によるレコード結合では、SQL 生成はサポートされません。

完全外部結合または部分外部結合のキーによる結合は、データベース/ドライバーがサポートしている場合にのみ対応しています。 一致しない入力フィールドについては、フィルター・ノードを使用するか、インポート・ノードのフィルター設定を使用して、フィールド名を変更することができます。

条件による結合の SQL 生成をサポートしています。

すべての結合のタイプで、入力が異なるデータベースで作成される場合は、SQL_SP_EXISTS はサポートされていません。

追加 入力がソートされていない場合のみ生成がサポートされます。 SQL 最適化は、入力の列数が同じ場合にのみ実行できます。
重複レコード (デフォルト) モードの「各グループの複合レコードを作成」が選択されている重複レコード・ノードは、SQL 最適化をサポートしません。
表 2. 簡単なサンプリングのサンプリング・ノードの SQL 生成のサポート
モード サンプル 最大サイズ シード Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
含む 最初 該当なし   Y Y Y Y Y Y
  n 件ごと オフ   Y Y Y Y   Y
    最大   Y Y Y Y   Y
  ランダム% オフ オフ Y   Y Y   Y
      オン Y   Y Y    
    最大 オフ Y   Y Y   Y
      オン Y   Y Y    
破棄 最初 オフ         Y    
    最大         Y    
  n 件ごと オフ   Y Y Y Y   Y
    最大   Y Y Y Y   Y
  ランダム% オフ オフ Y   Y Y   Y
      オン Y   Y Y    
    最大 オフ Y   Y Y   Y
      オン Y   Y Y    
表 3. レコード集計ノードの SQL 生成サポート
ストレージ 合計 平均値 最小 最大 標準偏差 中央値 差異 パーセンタイル
整数 Y Y Y Y Y Y* Y Y Y*
実数 Y Y Y Y Y Y* Y Y Y*
日付     Y Y   Y* Y   Y*
時刻     Y Y   Y* Y   Y*
タイムスタンプ     Y Y   Y* Y   Y*
ストリング     Y Y   Y* Y   Y*

* 中央値とパーセンタイルは Oracle でサポートされています。

表 4。 フィールド設定ノード
SQL 生成をサポートしているノード ノート
タイプ データ型ノードがインスタンス化されており、ABORT または WARN データ型検査が指定されている場合、生成をサポートします。
フィルター  
導出 派生式用に生成された SQL がサポートされている場合、SQL 生成をサポートします (このページで後述する式を参照してください)。
アンサンブル 連続型対象の SQL 生成をサポートしています。 その他の対象の場合は、「最高確信度勝ち取り」アンサンブル方法が使用されている場合にのみ、生成をサポートします。
充てん文字 派生式用に生成された SQL がサポートされている場合は、SQL 生成をサポートします。
匿名化 連続型対象の SQL 生成、名義型、フラグ型対象の部分的 SQL 生成をサポートしています。
再分類  
データ分割 「分位 (等カウント)」データ分割方法が使用されており、「可能ならビンの値から読み込む」オプションが選択されている場合、SQL 生成をサポートします。 ビン境界の計算方法の違いにより (この違いはビン フィールド内のデータの分布の性質が原因)、通常のフローの実行結果と SQL プッシュバックの結果を比較する際に、データ分割出力に差異が表れる場合があります。 これを避けるには、「レコード件数」分位方法と、「隣のビンへ追加」または「現在のまま保持」の分位のいずれかを使用して、フロー実行の 2 つの方式の間で最も近い一致を取得します。
RFM 分析 「可能ならビンの値から読み込む」オプションが選択されている場合 SQL 生成がサポートされますが、下流ノードはサポートしません。
パーティション SQL 生成をサポートしてレコードをデータ区分に割り当てる :
フラグ設定  
再構成  
表 5. グラフ・ノード
SQL 生成をサポートしているノード ノート
配布  
ウェブ  
評価  

一部のモデルについて、モデル・ナゲットの SQL を生成し、モデルのスコアリング段階をデータベースにプッシュ バックします。 この機能の主な使用はパフォーマンスの改善でなく、これらのナゲットを含むフローがすべての SQL をプッシュバックできるようにするためです。 詳しくは、 モデル・ナゲットからの SQL の生成 を参照してください。

表 6. モデル・ナゲット
SQL 生成をサポートしているモデル・ナゲット ノート
C&R ツリー 単一ツリー・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
QUEST  
カイ 2 乗自動反復検出アルゴリズム  
C5.0  
ディシジョン・リスト  
線形 標準モデル・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
ニューラル・ネットワーク 標準モデル・オプションの SQL 生成はサポートしますが (多層パーセプトロンのみ)、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
PCA/因子分析  
ロジスティック 多項式手続きの SQL 生成をサポートしていますが、2 項式ではサポートされていません。 多項式の場合、確信度が選択されている場合、対象の種類がフラグ型でない限り生成はサポートされません。
生成されたルールセット  
自動分類 ユーザー定義関数 (UDF) スコアリング アダプターが使用可能な場合、これらのナゲットは SQL プッシュバックをサポートします。 また、連続型ターゲットの SQL 生成または「最高確信度勝ち取り」アンサンブル法を使用した場合、さらに下流でのプッシュバックがこれらのナゲットでサポートされます。
自動数値
表 7. 出力ノード
SQL 生成をサポートしているノード ノート
強調表示式で SQL 生成がサポートされている場合に生成をサポートします。
行列(M) フィールド・オプションで「すべての数値」が選択されている場合を除いて、生成がサポートされています。
解析 選択されているオプションに応じて、生成をサポートします。
変換  
統計 「相関関係」オプションが使用されていない場合、生成をサポートします。
報告書  
グローバルの設定