資料の 英語版 に戻るSQL プッシュバックがサポートされているノード
SQL の最適化 (SPSS Modeler)
最終更新: 2025年2月12日
このセクションでは、SQL プッシュバックがサポートされているノードを、データ・マイニング操作の説明とともに、表にまとめています。 以下の表に記載されていないノードについては、SQL プッシュバックはサポートされていません。
SQL 生成をサポートしているノード | ノート |
---|---|
選択 | 選択式自体の SQL 生成がサポートされている場合のみ、生成をサポートします。 いずれかのフィールドにヌルが含まれている場合、SQL 生成では、ネイティブ SPSS Modelerで指定されているものと同じ破棄の結果は得られません。 |
サンプル | 単純なサンプリングは、データベースに応じたさまざまな度合いで SQL 生成をサポートします。 |
集計 | グループ集計の SQL 生成サポートは、データ・ストレージ・タイプによって異なります。 |
RFM 集計 | 2 番目または 3 番目に最近のトランザクションの日付を保存する場合を除いて、または最新のトランザクションを含む場合のみ生成をサポートします。 ただし、 関数がプッシュバックされる場合は、最新のトランザクションを含んでも機能しません。 |
ソート | |
マージ | 順序によるレコード結合では、SQL 生成はサポートされません。 完全外部結合または部分外部結合のキーによる結合は、データベース/ドライバーがサポートしている場合にのみ対応しています。 一致しない入力フィールドについては、フィルター・ノードを使用するか、インポート・ノードのフィルター設定を使用して、フィールド名を変更することができます。 条件による結合の SQL 生成をサポートしています。 すべての結合のタイプで、入力が異なるデータベースで作成される場合は、 |
追加 | 入力がソートされていない場合のみ生成がサポートされます。 SQL 最適化は、入力の列数が同じ場合にのみ実行できます。 |
重複レコード | (デフォルト) モードの「各グループの複合レコードを作成」が選択されている重複レコード・ノードは、SQL 最適化をサポートしません。 |
モード | サンプル | 最大サイズ | シード | Db2 for z/OS | Db2 for OS/400 | Db2 for Win/UNIX | Oracle | SQL Server | Teradata |
---|---|---|---|---|---|---|---|---|---|
含む | 最初 | 該当なし | Y | Y | Y | Y | Y | Y | |
n 件ごと | オフ | Y | Y | Y | Y | Y | |||
最大 | Y | Y | Y | Y | Y | ||||
ランダム% | オフ | オフ | Y | Y | Y | Y | |||
オン | Y | Y | Y | ||||||
最大 | オフ | Y | Y | Y | Y | ||||
オン | Y | Y | Y | ||||||
破棄 | 最初 | オフ | Y | ||||||
最大 | Y | ||||||||
n 件ごと | オフ | Y | Y | Y | Y | Y | |||
最大 | Y | Y | Y | Y | Y | ||||
ランダム% | オフ | オフ | Y | Y | Y | Y | |||
オン | Y | Y | Y | ||||||
最大 | オフ | Y | Y | Y | Y | ||||
オン | Y | Y | Y |
ストレージ | 合計 | 平均値 | 最小 | 最大 | 標準偏差 | 中央値 | 数 | 差異 | パーセンタイル |
---|---|---|---|---|---|---|---|---|---|
整数 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
実数 | Y | Y | Y | Y | Y | Y* | Y | Y | Y* |
日付 | Y | Y | Y* | Y | Y* | ||||
時刻 | Y | Y | Y* | Y | Y* | ||||
タイムスタンプ | Y | Y | Y* | Y | Y* | ||||
ストリング | Y | Y | Y* | Y | Y* |
* 中央値とパーセンタイルは Oracle でサポートされています。
SQL 生成をサポートしているノード | ノート |
---|---|
タイプ | データ型ノードがインスタンス化されており、 または データ型検査が指定されている場合、生成をサポートします。 |
フィルター | |
導出 | 派生式用に生成された SQL がサポートされている場合、SQL 生成をサポートします (このページで後述する式を参照してください)。 |
アンサンブル | 連続型対象の SQL 生成をサポートしています。 その他の対象の場合は、「最高確信度勝ち取り」アンサンブル方法が使用されている場合にのみ、生成をサポートします。 |
充てん文字 | 派生式用に生成された SQL がサポートされている場合は、SQL 生成をサポートします。 |
匿名化 | 連続型対象の SQL 生成、名義型、フラグ型対象の部分的 SQL 生成をサポートしています。 |
再分類 | |
データ分割 | 「分位 (等カウント)」データ分割方法が使用されており、「可能ならビンの値から読み込む」オプションが選択されている場合、SQL 生成をサポートします。 ビン境界の計算方法の違いにより (この違いはビン フィールド内のデータの分布の性質が原因)、通常のフローの実行結果と SQL プッシュバックの結果を比較する際に、データ分割出力に差異が表れる場合があります。 これを避けるには、「レコード件数」分位方法と、「隣のビンへ追加」または「現在のまま保持」の分位のいずれかを使用して、フロー実行の 2 つの方式の間で最も近い一致を取得します。 |
RFM 分析 | 「可能ならビンの値から読み込む」オプションが選択されている場合 SQL 生成がサポートされますが、下流ノードはサポートしません。 |
パーティション | SQL 生成をサポートしてレコードをデータ区分に割り当てる : |
フラグ設定 | |
再構成 |
SQL 生成をサポートしているノード | ノート |
---|---|
配布 | |
ウェブ | |
評価 |
一部のモデルについて、モデル・ナゲットの SQL を生成し、モデルのスコアリング段階をデータベースにプッシュ バックします。 この機能の主な使用はパフォーマンスの改善でなく、これらのナゲットを含むフローがすべての SQL をプッシュバックできるようにするためです。 詳しくは、 モデル・ナゲットからの SQL の生成 を参照してください。
SQL 生成をサポートしているモデル・ナゲット | ノート |
---|---|
C&R ツリー | 単一ツリー・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。 |
QUEST | |
カイ 2 乗自動反復検出アルゴリズム | |
C5.0 | |
ディシジョン・リスト | |
線形 | 標準モデル・オプションの SQL 生成はサポートしますが、ブースト、バギング、または大規模データセット・オプションはサポートしていません。 |
ニューラル・ネットワーク | 標準モデル・オプションの SQL 生成はサポートしますが (多層パーセプトロンのみ)、ブースト、バギング、または大規模データセット・オプションはサポートしていません。 |
PCA/因子分析 | |
ロジスティック | 多項式手続きの SQL 生成をサポートしていますが、2 項式ではサポートされていません。 多項式の場合、確信度が選択されている場合、対象の種類がフラグ型でない限り生成はサポートされません。 |
生成されたルールセット | |
自動分類 | ユーザー定義関数 (UDF) スコアリング アダプターが使用可能な場合、これらのナゲットは SQL プッシュバックをサポートします。 また、連続型ターゲットの SQL 生成または「最高確信度勝ち取り」アンサンブル法を使用した場合、さらに下流でのプッシュバックがこれらのナゲットでサポートされます。 |
自動数値 |
SQL 生成をサポートしているノード | ノート |
---|---|
表 | 強調表示式で SQL 生成がサポートされている場合に生成をサポートします。 |
行列(M) | フィールド・オプションで「すべての数値」が選択されている場合を除いて、生成がサポートされています。 |
解析 | 選択されているオプションに応じて、生成をサポートします。 |
変換 | |
統計 | 「相関関係」オプションが使用されていない場合、生成をサポートします。 |
報告書 | |
グローバルの設定 |