0 / 0
Go back to the English version of the documentation
Węzły obsługujące instrukcje SQL pushback
Last updated: 04 lip 2023
Optymalizacja SQL (SPSS Modeler)

W tabelach w tej sekcji znajdują się węzły reprezentujące operacje eksploracji danych, które obsługują przekazywanie danych SQL do systemu. Jeśli węzeł nie jest wyświetlany w tych tabelach, nie obsługuje funkcji SQL pushback.

Tabela 1. Węzły operacji związanych z rekordami
Węzły obsługujące generowanie kodu SQL Uwagi
Wybierz Obsługuje generowanie tylko wtedy, gdy obsługiwane jest generowanie kodu SQL dla samego wyrażenia wyboru. Jeśli w dowolnym polu występują wartości puste, generowanie kodu SQL nie daje tych samych wyników dla odrzuceń, jakie zostały podane w rodzimym programie SPSS Modeler.
Próba Proste próbkowanie obsługuje generowanie kodu SQL w różnym stopniu w zależności od bazy danych.
Agregacja Obsługa generowania kodu SQL dla agregacji zależy od typu składowania danych.
Agregacja RFM Obsługuje generowanie z wyjątkiem, gdy zapisuje datę drugiej lub trzeciej najnowszej transakcji lub jeśli tylko uwzględnia najnowsze transakcje. Uwzględnienie najnowszych transakcji działa jednak, gdy funkcja datetime_date(YEAR,MONTH,DAY) zostanie przekazana do analizy wstępnej.
Sortuj  
Scal Brak generowanego kodu SQL dla łączenia wg kolejności.

Łączenie wg klucza z pełnym lub częściowym łączeniem zewnętrznym jest obsługiwane tylko, jeśli obsługuje je baza danych/sterownik. Niepasujące pola wejściowe mogą być zmieniane za pomocą węzła filtrowania lub ustawień filtru węzła importu.

Obsługuje generowanie kodu SQL dla łączenia wg warunku.

Dla wszystkich typów łączenia SQL_SP_EXISTS nie jest obsługiwane, jeśli dane wejściowe pochodzą z różnych baz danych.

Dodaj Obsługuje generowanie, jeśli dane wejściowe są nieposortowane. Optymalizacja SQL jest możliwa tylko wtedy, gdy dane wejściowe mają taką samą liczbę kolumn.
Powtórzenia Węzeł odrębny z trybem domyślnym (default) Utwórz rekord złożony dla każdej grupy nie obsługuje optymalizacji SQL.
Tabela 2. Obsługa generowania kodu SQL w węźle próby dla prostego próbkowania
Tryb Próba Maks. wielkość Wartość startowa Db2 for z/OS Db2 for OS/400 Db2 for Win/UNIX Oracle SQL Server Teradata
Dołącz Pierwsza n/d   Y Y Y Y Y Y
  Co n-ty rekord wył.   Y Y Y Y   Y
    maks   Y Y Y Y   Y
  Losowo % ze wszystkich wył. wył. Y   Y Y   Y
      na Y   Y Y    
    maks wył. Y   Y Y   Y
      na Y   Y Y    
Odrzuć Pierwsza wył.         Y    
    maks         Y    
  Co n-ty rekord wył.   Y Y Y Y   Y
    maks   Y Y Y Y   Y
  Losowo % ze wszystkich wył. wył. Y   Y Y   Y
      na Y   Y Y    
    maks wył. Y   Y Y   Y
      na Y   Y Y    
Tabela 3. Obsługa generowania kodu SQL w węźle agregacji
Pamięć masowa Suma Średnia Min. Maks. OdchStd Mediana Liczebność Wariancja Percentyl
Liczba całkowita Y Y Y Y Y Y* Y Y Y*
BRL Y Y Y Y Y Y* Y Y Y*
Data     Y Y   Y* Y   Y*
Czas     Y Y   Y* Y   Y*
Datownik     Y Y   Y* Y   Y*
Łańcuch     Y Y   Y* Y   Y*

* Mediana i Percentyl nie są obsługiwane na serwerach Oracle.

Tabela 4. Węzły operacji na zmiennych
Węzły obsługujące generowanie kodu SQL Uwagi
Typ Obsługuje generowanie kodu SQL, jeśli węzeł typu jest określony i nie określono sprawdzania typu ABORT lub WARN.
Filtr  
Wyliczanie Obsługuje generowanie kodu SQL, jeśli kod SQL wygenerowany dla wyrażenia wyliczania jest obsługiwany (patrz wyrażenia później na tej stronie).
Zespół Obsługuje generowanie kodu SQL dla docelowych wartości ilościowych. W przypadku innych celów obsługuje generowanie tylko wtedy, gdy używana jest metoda Najwyższa ufność wygrywa .
Wypełnianie Obsługuje generowanie kodu SQL, jeśli kod SQL wygenerowany dla wyrażenia wyliczania jest obsługiwany.
Anonimizacja Obsługuje generowanie kodu SQL dla docelowych wartości ilościowych oraz częściowe generowanie kodu SQL dla nominalnej zmiennej przewidywanej i przewidywanej zmiennej typu flaga.
Rekodowanie  
Grupowanie w przedziałach Obsługuje generowanie kodu SQL, jeśli używana jest metoda kategoryzacji Tiles (równa liczebność) , a wybrana jest opcja Odczytaj z karty Wartości podziałów, jeśli są dostępne . Ze względu na różnice w sposobie obliczania granic miejsca składowania (jest to spowodowane naturą rozkładu danych w polach składowania), różnice w danych wyjściowych łączenia mogą być widoczne podczas porównywania normalnych wyników wykonania przepływu i wyników przekazywania danych SQL. Aby tego uniknąć, należy użyć metody tiling Record count oraz Add to next (Dodaj do następnego) lub Keep in current (Pozostań w bieżących), aby uzyskać najbliższą zgodność między dwiema metodami wykonywania przepływu.
Analiza RFM Obsługuje generowanie kodu SQL, jeśli wybrano opcję Odczytaj z karty Wartości podziałów, jeśli są dostępne , ale kolejne węzły nie będą obsługiwać tej opcji.
Podzbiór Obsługuje generowanie kodu SQL, aby przypisać rekordy do podzbiorów.
Ustaw flagę na  
Restrukturyzacja  
Tabela 5. Węzły wykresów
Węzły obsługujące generowanie kodu SQL Uwagi
Dystrybucja  
Analizy  
Ocena  

Dla niektórych modeli można wygenerować kod SQL dla modeli użytkowych, przekazując do analizy wstępnej do bazy danych etap oceny modelu. Głównym zastosowaniem tej funkcji nie jest zwiększenie wydajności, ale umożliwienie przepływu danych zawierających te modele użytkowe, tak aby ich pełny kod SQL został przesunięty z powrotem. Więcej informacji na ten temat zawiera sekcja Generowanie instrukcji SQL na podstawie modeli użytkowych .

Tabela 6. wartościowe informacje z modelu
Modele użytkowe obsługujące generowanie kodu SQL Uwagi
Drzewo K&R Obsługuje generowanie kodu SQL dla pojedynczej opcji drzewa, ale nie dla opcji boosting, bagging lub dużych zbiorów danych.
QUEST  
CHAID  
C5.0  
Lista decyzyjna  
Liniowy Obsługuje generowanie kodu SQL dla standardowej opcji modelu, ale nie dla opcji boosting, bagging lub dużych zbiorów danych.
Sieć neuronowa Obsługuje generowanie kodu SQL dla standardowej opcji modelu (tylko wielowarstwowe Perceptron), ale nie dla opcji boosting, bagging lub dużych zbiorów danych.
Redukcja wymiarów  
Logistyczna Obsługuje generowanie kodu SQL dla procedury wielomianowej, ale nie dla dwumianowej. W przypadku wielomianowego generowanie nie jest obsługiwane, jeśli wybrane są ufności, chyba że typem celu jest flaga.
Wygenerowane zestawy reguł  
Auto Klasyfikacja Jeśli włączony jest składnik Scoring Adapter funkcji zdefiniowanej przez użytkownika (UDF), te modele użytkowe obsługują analizę wstępną SQL. Ponadto, jeśli używana jest metoda generowania kodu SQL dla celów ilościowych lub metoda z zespołem Najwyższa ufność , te modele użytkowe obsługują dalsze przekazywanie danych w dół do dalszego przepływu.
Auto Predykcja
Tabela 7. Węzły wyjściowe
Węzły obsługujące generowanie kodu SQL Uwagi
Tabela Obsługuje generowanie, jeśli generowanie kodu SQL jest obsługiwane w przypadku wyrażenia podświetlenia.
Macierz Obsługuje generowanie, z wyjątkiem sytuacji, gdy opcja Wszystkie cyfry jest wybrana dla opcji Pola.
Analiza Obsługuje generowanie w zależności od wybranych opcji.
Transformuj  
Narzędzia statystyczne Obsługuje generowanie, jeśli opcja Correlate nie jest używana.
Raport  
Globalne  
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more