Die Tabellen in diesem Abschnitt enthalten eine Auflistung der Knoten für die Data-Mining-Operationen, die das SQL-Pushback unterstützen. Wenn ein Knoten in diesen Tabellen nicht enthalten ist, unterstützt er das SQL-Pushback nicht.
Tabelle 1. Datensatzoperationsknoten
Knoten mit Unterstützung der SQL-Generierung |
Hinweise |
Wählen |
Unterstützt die Generierung nur, wenn die SQL-Generierung für den Auswahlausdruck selbst unterstützt wird. Wenn Felder Nullwerte enthalten, führt die SQL-Generierung nicht zu denselben Ergebnissen wie im nativen SPSS Modeler. |
Beispiel |
Die einfache Stichprobenziehung unterstützt die SQL-Generierung bis zu einem gewissen Grad je nach Datenbank. |
Aggregieren |
Die Unterstützung der SQL-Generierung für die Aggregierung hängt vom Datenspeichertyp ab. |
RFM-Aggregat |
Unterstützt die Generierung, außer beim Speichern des Datums der zweit- oder drittaktuellsten Transaktion oder wenn nur aktuelle Transaktionen eingeschlossen werden. Die Einbeziehung der letzten Transaktionen funktioniert jedoch, wenn für die Funktion datetime_date(YEAR,MONTH,DAY) ein Pushback durchgeführt wird. |
Sortieren |
|
Zusammenführen |
Kein SQL generiert für Zusammenführen nach Schlüssel. Ein Zusammenführen nach Schlüssel mit vollständigem oder partiellem Outer Join wird nur unterstützt, falls sie auch von der Datenbank/dem Treiber unterstützt wird. Nicht übereinstimmende Eingabefelder können mithilfe eines Filterknotens oder über die Einstellungen "Filter" eines Importknotens umbenannt werden.
Unterstützt SQL-Generierung für die Zusammenführung nach Bedingung.
Für alle Zusammenführungstypen gilt, dass SQL_SP_EXISTS nicht unterstützt wird, wenn die Eingaben aus verschiedenen Datenbanken stammen.
|
Anhängen |
Unterstützt die Generierung bei unsortierten Eingaben. Die SQL-Optimierung ist nur möglich, wenn Ihre Eingaben jeweils dieselbe Anzahl Spalten haben. |
Duplikat |
Die SQL-Optimierung wird bei einem Duplikatknoten, bei dem der Modus (Standardmodus) Zusammengesetzten Datensatz für jede Gruppe erstellen ausgewählt ist, nicht unterstützt. |
Tabelle 2. Unterstützung der SQL-Generierung im Stichprobenknoten für einfache Stichprobenziehung
Modalwert |
Beispiel |
Max. Größe |
Startwert |
Db2 for z/OS |
Db2 for OS/400 |
Db2 for Win/UNIX |
Oracle |
SQL Server |
Teradata |
Einschließen |
Erste |
Nicht zutreffend |
|
Y |
Y |
Y |
Y |
Y |
Y |
|
1 in n |
aus |
|
Y |
Y |
Y |
Y |
|
Y |
|
|
max |
|
Y |
Y |
Y |
Y |
|
Y |
|
Zufällig % |
aus |
aus |
Y |
|
Y |
Y |
|
Y |
|
|
|
ein |
Y |
|
Y |
Y |
|
|
|
|
max |
aus |
Y |
|
Y |
Y |
|
Y |
|
|
|
ein |
Y |
|
Y |
Y |
|
|
Verwerfen |
Erste |
aus |
|
|
|
|
Y |
|
|
|
|
max |
|
|
|
|
Y |
|
|
|
1 in n |
aus |
|
Y |
Y |
Y |
Y |
|
Y |
|
|
max |
|
Y |
Y |
Y |
Y |
|
Y |
|
Zufällig % |
aus |
aus |
Y |
|
Y |
Y |
|
Y |
|
|
|
ein |
Y |
|
Y |
Y |
|
|
|
|
max |
aus |
Y |
|
Y |
Y |
|
Y |
|
|
|
ein |
Y |
|
Y |
Y |
|
|
Tabelle 3. Unterstützung der SQL-Generierung im Aggregatknoten
Speicher |
Summe |
Mittelwert |
Minimum |
Max |
Std.Abw. |
Median |
Anzahl |
Varianz |
Perzentil |
Integer |
Y |
Y |
Y |
Y |
Y |
J* |
Y |
Y |
J* |
Real |
Y |
Y |
Y |
Y |
Y |
J* |
Y |
Y |
J* |
Datum |
|
|
Y |
Y |
|
J* |
Y |
|
J* |
Zeit |
|
|
Y |
Y |
|
J* |
Y |
|
J* |
Timestamp |
|
|
Y |
Y |
|
J* |
Y |
|
J* |
Zeichenfolge |
|
|
Y |
Y |
|
J* |
Y |
|
J* |
* Median und Perzentil werden unter Oracle unterstützt.
Tabelle 4. Feldoperationsknoten
Knoten mit Unterstützung der SQL-Generierung |
Hinweise |
Typ |
Unterstützt SQL-Generierung, wenn der Typknoten instanziiert wird und keine ABORT - oder WARN -Typprüfung angegeben ist. |
Filtern |
|
Ableitung |
Unterstützt die SQL-Generierung, wenn für den Ableitungsausdruck generiertes SQL unterstützt wird (siehe Ausdrücke weiter unten auf dieser Seite). |
Ensemble |
Unterstützt SQL-Generierung für stetige Ziele. Bei anderen Zielen wird die Generierung nur unterstützt, wenn die Ensemble-Methode Höchste Konfidenz hat Vorrang verwendet wird. |
Füller |
Unterstützt die SQL-Generierung, wenn die für den Ableitungsausdruck generierte SQL unterstützt wird. |
Anonymisierung |
Unterstützt SQL-Generierung für stetige Ziele und die partielle SQL-Generierung für nominale und Flagziele. |
Umcodierung |
|
Klassierung |
Unterstützt SQL-Generierung, wenn die Klassiermethode n-tile (gleiche Anzahl) verwendet wird und die Option Von Registerkarte "Klassenwerte" lesen, sofern verfügbar ausgewählt ist. Infolge von (durch die Art der Verteilung von Daten in Klassenfeldern verursachten) Unterschieden in der Art, wie Klassengrenzen berechnet werden, stellen Sie möglicherweise Unterschiede bei der Klassierungsausgabe zwischen Ergebnissen der normalen Ablaufausführung und SQL-Pushback-Ergebnissen fest. Um dies zu vermeiden, verwenden Sie die Perzentilmethode Datensatzanzahl und N-Perzentile des Typs Zu nächstem hinzu oder In aktuellem beibehalten, um die größte Übereinstimmung zwischen den beiden Methoden der Ablaufausführung zu erhalten. |
RFM-Analyse |
Unterstützt SQL-Generierung, wenn die Option Von Registerkarte "Klassenwerte" lesen, sofern verfügbar ausgewählt ist, jedoch unterstützen dies nachgeordnete Knoten nicht. |
Partition |
Unterstützt SQL-Generierung für die Zuweisung von Datensätzen zu Partitionen. |
Dichotomknoten |
|
Umstrukturierung |
|
Tabelle 5. Knoten für Diagramme
Knoten mit Unterstützung der SQL-Generierung |
Hinweise |
Verteilung |
|
Internet |
|
Evaluierung |
|
Bei einigen Modellen kann SQL für das Modellnugget generiert werden, wobei die Modellscoring-Phase per Pushback an die Datenbank zurückgegeben wird. Diese Funktion dient nicht in erster Linie zur Leistungsverbesserung, sondern dazu, dass das gesamte SQL von Abläufen, die diese Nuggets enthalten, per Pushback zurückgeführt werden kann. Weitere Informationen finden Sie unter SQL aus Modellnuggets generieren .
Tabelle 6. Modellnuggets
Modellnuggets mit Unterstützung der SQL-Generierung |
Hinweise |
C&R-Baum |
Unterstützt SQL-Generierung für die Option für einzelne Bäume, nicht jedoch für Boosting, Bagging oder für große Datasetoptionen. |
QUEST |
|
CHAID |
|
C5.0 |
|
Entscheidungsliste |
|
Linear |
Unterstützt SQL-Generierung für die Standardmodelloption, nicht jedoch für Boosting, Bagging oder große Datasetoptionen. |
Neuronales Netz |
Unterstützt SQL-Generierung für die Standardmodelloption (nur Mehrschicht-Perzeptron), nicht jedoch für Boosting, Bagging oder große Datasetoptionen. |
Faktor/PCA |
|
Logistisch |
Unterstützt SQL-Generierung für das multinomiale, nicht jedoch für das binomiale Verfahren. Beim multinomialen Verfahren wird die Generierung nicht unterstützt, wenn Konfidenzen ausgewählt wurden, es sei denn, der Zieltyp ist "Flag". |
Generierte Regelsets |
|
Automatisches Klassifikationsmerkmal |
Wenn ein UDF-Scoring-Adapter (UDF - User Defined Function, benutzerdefinierte Funktion)
aktiviert ist, unterstützen diese Nuggets ein SQL-Pushback. Wenn entweder die SQL-Generierung für stetige Ziele oder die Ensemblemethode Höchste Konfidenz hat Vorrang verwendet wird, unterstützen diese Nuggets außerdem ein nachgeordnetes Pushback. |
Autonumerisch |
Tabelle 7. Ausgabeknoten
Knoten mit Unterstützung der SQL-Generierung |
Hinweise |
Tabelle |
Unterstützt die Generierung, wenn die SQL-Generierung für Hervorhebungsausdrücke unterstützt wird. |
Matrix |
Unterstützt die Generierung, außer wenn Alle numerischen Werte für die Option "Felder "ausgewählt wurde. |
Analyse |
Unterstützt die Generierung je nach den ausgewählten Optionen. |
Transformieren |
|
Statistik |
Unterstützt die Generierung, wenn die Option "Korrelieren" nicht verwendet wird. |
Bericht |
|
Globalwerte |
|