0 / 0

Knoten mit Unterstützung des SQL-Pushbacks

Letzte Aktualisierung: 01. Mai 2025
SQL-Optimierung (SPSS Modeler)

Die folgenden Tabellen zeigen Knoten, die Data-Mining-Operationen darstellen, die SQL-Pushback unterstützen. Wenn ein Knoten in diesen Tabellen nicht enthalten ist, unterstützt er das SQL-Pushback nicht.

Tabelle 1. Datensatzoperationsknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Wählen Unterstützt die Generierung nur, wenn die SQL-Generierung für den Auswahlausdruck selbst unterstützt wird. Wenn Felder Nullwerte enthalten, führt die SQL-Generierung nicht zu denselben Ergebnissen wie im nativen SPSS Modeler.
Beispiel Die einfache Stichprobenziehung unterstützt die SQL-Generierung bis zu einem gewissen Grad je nach Datenbank.
Aggregation Die Unterstützung der SQL-Generierung für die Aggregierung hängt vom Datenspeichertyp ab.
RFM-Aggregat Unterstützt die Generierung, außer beim Speichern des Datums der zweit- oder drittaktuellsten Transaktion oder wenn nur aktuelle Transaktionen eingeschlossen werden. Die Einbeziehung der letzten Transaktionen funktioniert jedoch, wenn für die Funktion datetime_date(YEAR,MONTH,DAY) ein Pushback durchgeführt wird.
Sortieren  
Zusammenführen Kein SQL generiert für Zusammenführen nach Schlüssel.

Ein Zusammenführen nach Schlüssel mit vollständigem oder partiellem Outer Join wird nur unterstützt, falls sie auch von der Datenbank/dem Treiber unterstützt wird. Nicht übereinstimmende Eingabefelder können mit Hilfe eines Filterknotens oder der Filtereinstellungen eines Importknotens umbenannt werden.

Unterstützt SQL-Generierung für die Zusammenführung nach Bedingung.

Für alle Zusammenführungstypen gilt, dass SQL_SP_EXISTS nicht unterstützt wird, wenn die Eingaben aus verschiedenen Datenbanken stammen.

Anhängen Unterstützt die Generierung bei unsortierten Eingaben. Die SQL-Optimierung ist nur möglich, wenn Ihre Eingaben jeweils dieselbe Anzahl Spalten haben.
Eindeutig Die SQL-Optimierung wird bei einem Duplikatknoten, bei dem der Modus (Standardmodus) Zusammengesetzten Datensatz für jede Gruppe erstellen ausgewählt ist, nicht unterstützt.
Tabelle 2. Unterstützung der SQL-Generierung im Stichprobenknoten für einfache Stichprobenziehung
Modus Beispiel Max. Größe Startwert Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
Einschließen Erste nicht zutreffend   Y Y Y Y Y Y
  1 in n aus   Y Y Y Y   Y
    Max.   Y Y Y Y   Y
  Zufällig % aus aus Y   Y Y   Y
      ein Y   Y Y    
    Max. aus Y   Y Y   Y
      ein Y   Y Y    
Verwerfen Erste aus         Y    
    Max.         Y    
  1 in n aus   Y Y Y Y   Y
    Max.   Y Y Y Y   Y
  Zufällig % aus aus Y   Y Y   Y
      ein Y   Y Y    
    Max. aus Y   Y Y   Y
      ein Y   Y Y    
Tabelle 3. Unterstützung der SQL-Generierung im Aggregatknoten
Speicher Summe Mittelwert Minimum Max. Std.Abw. Gemittelt Anzahl Abweichung Perzentil
Ganzzahl Y Y Y Y Y J* Y Y J*
Reell Y Y Y Y Y J* Y Y J*
Datum     Y Y   J* Y   J*
Zeit     Y Y   J* Y   J*
Zeitmarke     Y Y   J* Y   J*
Zeichenfolge     Y Y   J* Y   J*

* Median und Perzentil werden unter Oracle unterstützt.

Tabelle 4. Feldoperationsknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Typ Die SQL-Generierung wird nur unterstützt, wenn der Knoten Type instanziiert ist und keine ABORT oder WARN Typenprüfung angegeben ist.
Filtern  
Ableitung

Die SQL-Generierung wird nur unterstützt, wenn die aus dem Derive-Ausdruck generierte SQL gültig ist.

Jedoch, SPSS Modeler kann jedoch kein SQL generieren, wenn Sie für die Option Ableiten als den Status oder die Anzahl wählen.

  • STATE kann nicht in SQL übersetzt werden, da es von einer dauerhaften Zustandsverfolgung abhängt, die SQL von Natur aus nicht beherrscht.
  • COUNT erfordert das Führen einer laufenden Summe, was Standard-SQL ebenfalls nicht unterstützt.
Ensemble Unterstützt SQL-Generierung für stetige Ziele. Bei anderen Zielen wird die Generierung nur unterstützt, wenn die Ensemble-Methode Höchste Konfidenz hat Vorrang verwendet wird.
Füller Die SQL-Generierung wird unterstützt, wenn das aus dem Derive-Ausdruck generierte SQL gültig ist.
Anonymisieren Unterstützt SQL-Generierung für stetige Ziele und die partielle SQL-Generierung für nominale und Flagziele.
Umcodierung  
Klassierung Die SQL-Generierung wird unterstützt, wenn die Binning-Methode Kacheln (gleiche Anzahl) verwendet wird und die Option Aus Bin-Werten lesen, falls verfügbar ausgewählt ist. Infolge von (durch die Art der Verteilung von Daten in Klassenfeldern verursachten) Unterschieden in der Art, wie Klassengrenzen berechnet werden, stellen Sie möglicherweise Unterschiede bei der Klassierungsausgabe zwischen Ergebnissen der normalen Ablaufausführung und SQL-Pushback-Ergebnissen fest. Um dies zu vermeiden, verwenden Sie die Perzentilmethode Datensatzanzahl und N-Perzentile des Typs Zu nächstem hinzu oder In aktuellem beibehalten, um die größte Übereinstimmung zwischen den beiden Methoden der Ablaufausführung zu erhalten.
RFM-Analyse Die SQL-Generierung wird unterstützt, wenn die Option Aus Bin-Werten lesen, wenn verfügbar ausgewählt ist, aber nachgelagerte Knoten unterstützen sie nicht.
Partitionierung Unterstützt SQL-Generierung für die Zuweisung von Datensätzen zu Partitionen.
Dichotomknoten  
Umstrukturierung  
Tabelle 5. Knoten für Diagramme
Knoten mit Unterstützung der SQL-Generierung Hinweise
Verteilung  
Website  
Evaluierung  

Bei einigen Modellen kann SQL für das Modellnugget generiert werden, wobei die Modellscoring-Phase per Pushback an die Datenbank zurückgegeben wird. Diese Funktion dient nicht in erster Linie zur Leistungsverbesserung, sondern dazu, dass das gesamte SQL von Abläufen, die diese Nuggets enthalten, per Pushback zurückgeführt werden kann. Weitere Informationen finden Sie unter SQL aus Modell-Nuggets generieren.

Tabelle 6. Modellnuggets
Modellnuggets mit Unterstützung der SQL-Generierung Hinweise
C&R-Baum Unterstützt SQL-Generierung für die Option für einzelne Bäume, nicht jedoch für Boosting, Bagging oder für große Datasetoptionen.
QUEST  
CHAID  
C5.0  
Entscheidungsliste  
Linear Unterstützt SQL-Generierung für die Standardmodelloption, nicht jedoch für Boosting, Bagging oder große Datasetoptionen.
Neuronales Netz Unterstützt SQL-Generierung für die Standardmodelloption (nur Mehrschicht-Perzeptron), nicht jedoch für Boosting, Bagging oder große Datasetoptionen.
Faktor/PCA  
Logistisch Unterstützt SQL-Generierung für das multinomiale, nicht jedoch für das binomiale Verfahren. Beim multinomialen Verfahren wird die Generierung nicht unterstützt, wenn Konfidenzen ausgewählt wurden, es sei denn, der Zieltyp ist "Flag".
Generierte Regelsets  
Automatisches Klassifikationsmerkmal Wenn ein UDF-Scoring-Adapter (UDF - User Defined Function, benutzerdefinierte Funktion) aktiviert ist, unterstützen diese Nuggets ein SQL-Pushback. Wenn entweder die SQL-Generierung für stetige Ziele oder die Ensemblemethode Höchste Konfidenz hat Vorrang verwendet wird, unterstützen diese Nuggets außerdem ein nachgeordnetes Pushback.
Autonumerisch Wenn ein UDF-Scoring-Adapter (UDF - User Defined Function, benutzerdefinierte Funktion) aktiviert ist, unterstützen diese Nuggets ein SQL-Pushback. Wenn entweder die SQL-Generierung für stetige Ziele oder die Ensemblemethode Höchste Konfidenz hat Vorrang verwendet wird, unterstützen diese Nuggets außerdem ein nachgeordnetes Pushback.
Tabelle 7. Ausgabeknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Tabelle Unterstützt die Generierung, wenn die SQL-Generierung für Hervorhebungsausdrücke unterstützt wird.
Matrix
Analyse Unterstützt die Generierung je nach den ausgewählten Optionen.
Transformieren  
Statistik Unterstützt die Erzeugung, wenn die Option Correlate nicht verwendet wird.
Bericht  
Globalwerte