0 / 0
Zurück zur englischen Version der Dokumentation
Knoten mit Unterstützung des SQL-Pushbacks
Letzte Aktualisierung: 07. Okt. 2024
SQL-Optimierung (SPSS Modeler)

Die Tabellen in diesem Abschnitt enthalten eine Auflistung der Knoten für die Data-Mining-Operationen, die das SQL-Pushback unterstützen. Wenn ein Knoten in diesen Tabellen nicht enthalten ist, unterstützt er das SQL-Pushback nicht.

Tabelle 1. Datensatzoperationsknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Wählen Unterstützt die Generierung nur, wenn die SQL-Generierung für den Auswahlausdruck selbst unterstützt wird. Wenn Felder Nullwerte enthalten, führt die SQL-Generierung nicht zu denselben Ergebnissen wie im nativen SPSS Modeler.
Beispiel Die einfache Stichprobenziehung unterstützt die SQL-Generierung bis zu einem gewissen Grad je nach Datenbank.
Aggregieren Die Unterstützung der SQL-Generierung für die Aggregierung hängt vom Datenspeichertyp ab.
RFM-Aggregat Unterstützt die Generierung, außer beim Speichern des Datums der zweit- oder drittaktuellsten Transaktion oder wenn nur aktuelle Transaktionen eingeschlossen werden. Die Einbeziehung der letzten Transaktionen funktioniert jedoch, wenn für die Funktion datetime_date(YEAR,MONTH,DAY) ein Pushback durchgeführt wird.
Sortieren  
Zusammenführen Kein SQL generiert für Zusammenführen nach Schlüssel.

Ein Zusammenführen nach Schlüssel mit vollständigem oder partiellem Outer Join wird nur unterstützt, falls sie auch von der Datenbank/dem Treiber unterstützt wird. Nicht übereinstimmende Eingabefelder können mithilfe eines Filterknotens oder über die Einstellungen "Filter" eines Importknotens umbenannt werden.

Unterstützt SQL-Generierung für die Zusammenführung nach Bedingung.

Für alle Zusammenführungstypen gilt, dass SQL_SP_EXISTS nicht unterstützt wird, wenn die Eingaben aus verschiedenen Datenbanken stammen.

Anhängen Unterstützt die Generierung bei unsortierten Eingaben. Die SQL-Optimierung ist nur möglich, wenn Ihre Eingaben jeweils dieselbe Anzahl Spalten haben.
Duplikat Die SQL-Optimierung wird bei einem Duplikatknoten, bei dem der Modus (Standardmodus) Zusammengesetzten Datensatz für jede Gruppe erstellen ausgewählt ist, nicht unterstützt.
Tabelle 2. Unterstützung der SQL-Generierung im Stichprobenknoten für einfache Stichprobenziehung
Modalwert Beispiel Max. Größe Startwert Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
Einschließen Erste Nicht zutreffend   Y Y Y Y Y Y
  1 in n aus   Y Y Y Y   Y
    max   Y Y Y Y   Y
  Zufällig % aus aus Y   Y Y   Y
      ein Y   Y Y    
    max aus Y   Y Y   Y
      ein Y   Y Y    
Verwerfen Erste aus         Y    
    max         Y    
  1 in n aus   Y Y Y Y   Y
    max   Y Y Y Y   Y
  Zufällig % aus aus Y   Y Y   Y
      ein Y   Y Y    
    max aus Y   Y Y   Y
      ein Y   Y Y    
Tabelle 3. Unterstützung der SQL-Generierung im Aggregatknoten
Speicher Summe Mittelwert Minimum Max Std.Abw. Median Anzahl Varianz Perzentil
Integer Y Y Y Y Y J* Y Y J*
Real Y Y Y Y Y J* Y Y J*
Datum     Y Y   J* Y   J*
Zeit     Y Y   J* Y   J*
Timestamp     Y Y   J* Y   J*
Zeichenfolge     Y Y   J* Y   J*

* Median und Perzentil werden unter Oracle unterstützt.

Tabelle 4. Feldoperationsknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Typ Unterstützt SQL-Generierung, wenn der Typknoten instanziiert wird und keine ABORT- oder WARN-Typprüfung angegeben ist.
Filtern  
Ableitung Unterstützt die SQL-Generierung, wenn für den Ableitungsausdruck generiertes SQL unterstützt wird (siehe Ausdrücke weiter unten auf dieser Seite).
Ensemble Unterstützt SQL-Generierung für stetige Ziele. Bei anderen Zielen wird die Generierung nur unterstützt, wenn die Ensemble-Methode Höchste Konfidenz hat Vorrang verwendet wird.
Füller Unterstützt die SQL-Generierung, wenn die für den Ableitungsausdruck generierte SQL unterstützt wird.
Anonymisierung Unterstützt SQL-Generierung für stetige Ziele und die partielle SQL-Generierung für nominale und Flagziele.
Umcodierung  
Klassierung Unterstützt SQL-Generierung, wenn die Klassiermethode n-tile (gleiche Anzahl) verwendet wird und die Option Von Registerkarte "Klassenwerte" lesen, sofern verfügbar ausgewählt ist. Infolge von (durch die Art der Verteilung von Daten in Klassenfeldern verursachten) Unterschieden in der Art, wie Klassengrenzen berechnet werden, stellen Sie möglicherweise Unterschiede bei der Klassierungsausgabe zwischen Ergebnissen der normalen Ablaufausführung und SQL-Pushback-Ergebnissen fest. Um dies zu vermeiden, verwenden Sie die Perzentilmethode Datensatzanzahl und N-Perzentile des Typs Zu nächstem hinzu oder In aktuellem beibehalten, um die größte Übereinstimmung zwischen den beiden Methoden der Ablaufausführung zu erhalten.
RFM-Analyse Unterstützt SQL-Generierung, wenn die Option Von Registerkarte "Klassenwerte" lesen, sofern verfügbar ausgewählt ist, jedoch unterstützen dies nachgeordnete Knoten nicht.
Partition Unterstützt SQL-Generierung für die Zuweisung von Datensätzen zu Partitionen.
Dichotomknoten  
Umstrukturierung  
Tabelle 5. Knoten für Diagramme
Knoten mit Unterstützung der SQL-Generierung Hinweise
Verteilung  
Internet  
Evaluierung  

Bei einigen Modellen kann SQL für das Modellnugget generiert werden, wobei die Modellscoring-Phase per Pushback an die Datenbank zurückgegeben wird. Diese Funktion dient nicht in erster Linie zur Leistungsverbesserung, sondern dazu, dass das gesamte SQL von Abläufen, die diese Nuggets enthalten, per Pushback zurückgeführt werden kann. Weitere Informationen finden Sie unter SQL aus Modellnuggets generieren .

Tabelle 6. Modellnuggets
Modellnuggets mit Unterstützung der SQL-Generierung Hinweise
C&R-Baum Unterstützt SQL-Generierung für die Option für einzelne Bäume, nicht jedoch für Boosting, Bagging oder für große Datasetoptionen.
QUEST  
CHAID  
C5.0  
Entscheidungsliste  
Linear Unterstützt SQL-Generierung für die Standardmodelloption, nicht jedoch für Boosting, Bagging oder große Datasetoptionen.
Neuronales Netz Unterstützt SQL-Generierung für die Standardmodelloption (nur Mehrschicht-Perzeptron), nicht jedoch für Boosting, Bagging oder große Datasetoptionen.
Faktor/PCA  
Logistisch Unterstützt SQL-Generierung für das multinomiale, nicht jedoch für das binomiale Verfahren. Beim multinomialen Verfahren wird die Generierung nicht unterstützt, wenn Konfidenzen ausgewählt wurden, es sei denn, der Zieltyp ist "Flag".
Generierte Regelsets  
Automatisches Klassifikationsmerkmal Wenn ein UDF-Scoring-Adapter (UDF - User Defined Function, benutzerdefinierte Funktion) aktiviert ist, unterstützen diese Nuggets ein SQL-Pushback. Wenn entweder die SQL-Generierung für stetige Ziele oder die Ensemblemethode Höchste Konfidenz hat Vorrang verwendet wird, unterstützen diese Nuggets außerdem ein nachgeordnetes Pushback.
Autonumerisch
Tabelle 7. Ausgabeknoten
Knoten mit Unterstützung der SQL-Generierung Hinweise
Tabelle Unterstützt die Generierung, wenn die SQL-Generierung für Hervorhebungsausdrücke unterstützt wird.
Matrix Unterstützt die Generierung, außer wenn Alle numerischen Werte für die Option "Felder "ausgewählt wurde.
Analyse Unterstützt die Generierung je nach den ausgewählten Optionen.
Transformieren  
Statistik Unterstützt die Generierung, wenn die Option "Korrelieren" nicht verwendet wird.
Bericht  
Globalwerte  
Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen