SQL の最適化 (SPSS Modeler)

資料の英語版に戻る

SQL プッシュバックがサポートされているノード

最終更新: 2025年2月12日

SQL の最適化 (SPSS Modeler)

このセクションでは、SQL プッシュバックがサポートされているノードを、データ・マイニング操作の説明とともに、表にまとめています。以下の表に記載されていないノードについては、SQL プッシュバックはサポートされていません。

表 1. レコード設定ノード
SQL 生成をサポートしているノード	ノート
選択	選択式自体の SQL 生成がサポートされている場合のみ、生成をサポートします。いずれかのフィールドにヌルが含まれている場合、SQL 生成では、ネイティブ SPSS Modelerで指定されているものと同じ破棄の結果は得られません。
サンプル	単純なサンプリングは、データベースに応じたさまざまな度合いで SQL 生成をサポートします。
集計	グループ集計の SQL 生成サポートは、データ・ストレージ・タイプによって異なります。
RFM 集計	2 番目または 3 番目に最近のトランザクションの日付を保存する場合を除いて、または最新のトランザクションを含む場合のみ生成をサポートします。ただし、`datetime_date(YEAR,MONTH,DAY)` 関数がプッシュバックされる場合は、最新のトランザクションを含んでも機能しません。
ソート
マージ	順序によるレコード結合では、SQL 生成はサポートされません。完全外部結合または部分外部結合のキーによる結合は、データベース/ドライバーがサポートしている場合にのみ対応しています。一致しない入力フィールドについては、フィルター・ノードを使用するか、インポート・ノードのフィルター設定を使用して、フィールド名を変更することができます。条件による結合の SQL 生成をサポートしています。すべての結合のタイプで、入力が異なるデータベースで作成される場合は、`SQL_SP_EXISTS` はサポートされていません。
追加	入力がソートされていない場合のみ生成がサポートされます。 SQL 最適化は、入力の列数が同じ場合にのみ実行できます。
重複レコード	(デフォルト) モードの「各グループの複合レコードを作成」が選択されている重複レコード・ノードは、SQL 最適化をサポートしません。

表 2. 簡単なサンプリングのサンプリング・ノードの SQL 生成のサポート
モード	サンプル	最大サイズ	シード	Db2 for z/OS	Db2 for OS/400	Db2 for Win/UNIX	Oracle	SQL Server	Teradata
含む	最初	該当なし		Y	Y	Y	Y	Y	Y
	n 件ごと	オフ		Y	Y	Y	Y		Y
		最大		Y	Y	Y	Y		Y
	ランダム%	オフ	オフ	Y		Y	Y		Y
			オン	Y		Y	Y
		最大	オフ	Y		Y	Y		Y
			オン	Y		Y	Y
破棄	最初	オフ					Y
		最大					Y
	n 件ごと	オフ		Y	Y	Y	Y		Y
		最大		Y	Y	Y	Y		Y
	ランダム%	オフ	オフ	Y		Y	Y		Y
			オン	Y		Y	Y
		最大	オフ	Y		Y	Y		Y
			オン	Y		Y	Y

表 3. レコード集計ノードの SQL 生成サポート
ストレージ	合計	平均値	最小	最大	標準偏差	中央値	数	差異	パーセンタイル
整数	Y	Y	Y	Y	Y	Y*	Y	Y	Y*
実数	Y	Y	Y	Y	Y	Y*	Y	Y	Y*
日付			Y	Y		Y*	Y		Y*
時刻			Y	Y		Y*	Y		Y*
タイムスタンプ			Y	Y		Y*	Y		Y*
ストリング			Y	Y		Y*	Y		Y*

* 中央値とパーセンタイルは Oracle でサポートされています。

表 4。フィールド設定ノード
SQL 生成をサポートしているノード	ノート
タイプ	データ型ノードがインスタンス化されており、`ABORT` または `WARN` データ型検査が指定されている場合、生成をサポートします。
フィルター
導出	派生式用に生成された SQL がサポートされている場合、SQL 生成をサポートします (このページで後述する式を参照してください)。
アンサンブル	連続型対象の SQL 生成をサポートしています。その他の対象の場合は、「最高確信度勝ち取り」アンサンブル方法が使用されている場合にのみ、生成をサポートします。
充てん文字	派生式用に生成された SQL がサポートされている場合は、SQL 生成をサポートします。
匿名化	連続型対象の SQL 生成、名義型、フラグ型対象の部分的 SQL 生成をサポートしています。
再分類
データ分割	「分位 (等カウント)」データ分割方法が使用されており、「可能ならビンの値から読み込む」オプションが選択されている場合、SQL 生成をサポートします。ビン境界の計算方法の違いにより (この違いはビンフィールド内のデータの分布の性質が原因)、通常のフローの実行結果と SQL プッシュバックの結果を比較する際に、データ分割出力に差異が表れる場合があります。これを避けるには、「レコード件数」分位方法と、「隣のビンへ追加」または「現在のまま保持」の分位のいずれかを使用して、フロー実行の 2 つの方式の間で最も近い一致を取得します。
RFM 分析	「可能ならビンの値から読み込む」オプションが選択されている場合 SQL 生成がサポートされますが、下流ノードはサポートしません。
パーティション	SQL 生成をサポートしてレコードをデータ区分に割り当てる :
フラグ設定
再構成

表 5. グラフ・ノード
SQL 生成をサポートしているノード	ノート
配布
ウェブ
評価

一部のモデルについて、モデル・ナゲットの SQL を生成し、モデルのスコアリング段階をデータベースにプッシュバックします。この機能の主な使用はパフォーマンスの改善でなく、これらのナゲットを含むフローがすべての SQL をプッシュバックできるようにするためです。詳しくは、モデル・ナゲットからの SQL の生成を参照してください。

表 6. モデル・ナゲット
SQL 生成をサポートしているモデル・ナゲット	ノート
C&R ツリー	単一ツリー・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
QUEST
カイ 2 乗自動反復検出アルゴリズム
C5.0
ディシジョン・リスト
線形	標準モデル・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
ニューラル・ネットワーク	標準モデル・オプションの SQL 生成はサポートしますが (多層パーセプトロンのみ)、ブースト、バギング、または大規模データセット・オプションはサポートしていません。
PCA/因子分析
ロジスティック	多項式手続きの SQL 生成をサポートしていますが、2 項式ではサポートされていません。多項式の場合、確信度が選択されている場合、対象の種類がフラグ型でない限り生成はサポートされません。
生成されたルールセット
自動分類	ユーザー定義関数 (UDF) スコアリングアダプターが使用可能な場合、これらのナゲットは SQL プッシュバックをサポートします。また、連続型ターゲットの SQL 生成または「最高確信度勝ち取り」アンサンブル法を使用した場合、さらに下流でのプッシュバックがこれらのナゲットでサポートされます。
自動数値

表 7. 出力ノード
SQL 生成をサポートしているノード	ノート
表	強調表示式で SQL 生成がサポートされている場合に生成をサポートします。
行列(M)	フィールド・オプションで「すべての数値」が選択されている場合を除いて、生成がサポートされています。
解析	選択されているオプションに応じて、生成をサポートします。
変換
統計	「相関関係」オプションが使用されていない場合、生成をサポートします。
報告書
グローバルの設定