0 / 0
Go back to the English version of the documentation
Ustawianie właściwości przepływów
Last updated: 22 wrz 2023
Ustawianie właściwości dla przepływów SPSS Modeler

Istnieje możliwość określenia właściwości, które mają zostać zastosowane do bieżącego przepływu.

Aby ustawić właściwości przepływu, kliknij ikonę Właściwości przepływu :
Ikona właściwości przepływu

Dostępne są następujące właściwości.

Opcje

Postanowienia ogólne
  • Maksymalna liczba wierszy do wyświetlenia w podglądzie danych. Określ liczbę pokazywanych wierszy, gdy wymagane jest zaprezentowanie danych węzła.
  • Ogranicz elementy dla zmiennych nominalnych. Należy wybrać tę opcję i określić maksymalną liczbę elementów dla zmiennych nominalnych (set), po których typem danych pola będzie Typeless(Typeless). Ta opcja jest przydatna podczas pracy z dużymi zmiennymi nominalnymi. Jednak gdy poziom pomiaru zmiennej jest ustawiony na wartość Typeless, jego rola jest automatycznie ustawiana na Brak. Oznacza to, że pola nie są dostępne do modelowania.
  • Odśwież węzły źródłowe w trakcie wykonywania. Wybierz tę opcję, aby automatycznie odświeżyć wszystkie węzły źródłowe (import) podczas uruchamiania bieżącego przepływu. To działanie jest analogiczne do kliknięcia przycisku Odśwież we właściwościach węzła importu, z tym wyjątkiem, że ta opcja powoduje automatyczne odświeżenie wszystkich węzłów importu (z wyjątkiem węzłów wejściowych użytkownika) dla bieżącego przepływu.
Data/Czas
  • Importuj datę/godzinę jako. Określ, czy korzystać ze składowania daty/czasu w przypadku zmiennych daty/czasu czy zaimportować te elementy jako zmienne łańcuchowe.
  • Format daty. Należy wybrać format daty, który ma być używany dla pól daty składowania lub gdy łańcuchy są interpretowane jako daty przez funkcje daty CLEM.
  • Format godziny. Należy wybrać format czasu, który ma być używany dla pól pamięci czasu, lub gdy łańcuchy są interpretowane jako czasy przez funkcje czasu CLEM.
  • dni/mins przełączania. W przypadku formatów czasu należy wybrać, czy ujemne różnice w czasie są interpretowane jako odnoszące się do poprzedniego dnia lub godziny.
  • Data bazowa (1st Jan). Wybierz lata bazowe (zawsze 1 stycznia), które mają być używane przez funkcje daty CLEM, które działają z pojedynczą datą.
  • 2-cyfrowe daty rozpoczynają się od. Określ rok odcięcia, aby dodać cyfry wieku dla lat, które są oznaczone tylko 2 cyframi. Przykładowo: określenie wartości 1930 jako roku odcięcia spowoduje określenie daty 05/11/02 jako daty w roku 2002. To samo ustawienie spowoduje przyjęcie 20. wieku w przypadku dat po 30; więc przyjmuje się, że data 05/11/73 przypada w roku 1973.
  • Strefa czasowa. Wybierz sposób, w jaki strefa czasowa zostanie wybrana do użycia z wyrażeniem CLEM produktu datetime_now .
    • Jeśli zostanie wybrana opcja Serwer, strefa czasowa jest używana w miejscu, w którym działa program SPSS Modeler w czasie wykonywania (w niektórych przypadkach może to być taka sama wartość, jak opcja Klient ). Jeśli w przepływie używane są dane z bazy danych, a obsługiwana baza danych korzysta z funkcji SQL pushback, w wyrażeniu datetime_now zostanie użyty czas bazy danych.
    • Jeśli zostanie wybrana opcja Klient, strefa czasowa jest używana na komputerze, na którym jest zainstalowany program SPSS Modeler .
    • Alternatywnie dla strefy czasowej można wybrać dowolną z wartości czasu uniwersalnego.
formaty liczb
W przypadku standardowych, naukowych i walutowych formatów wyświetlania należy określić liczbę miejsc dziesiętnych, które mają być używane przy wyświetlaniu liczb rzeczywistych.
Narzędzie
Tych ustawień można użyć w celu zoptymalizowania wydajności przepływu.
  • Włącz ponowne zapisywanie przepływu. Wybierz tę opcję, aby włączyć ponowne zapisywanie przepływu. Przebudowywanie przepływu powoduje zmianę kolejności węzłów w przepływie za kulimi w celu uzyskania bardziej wydajnej operacji, bez zmiany semantyki przepływu.
  • Optymalizuj wyrażenia CLEM. Ta opcja umożliwia optymalizator wyszukiwanie wyrażeń CLEM, które mogą być wstępnie przetworzone przed uruchomieniem przepływu, w celu zwiększenia szybkości przetwarzania. W prostym przykładzie, jeśli istnieje wyrażenie, takie jak log(salary), optymalizator obliczy faktyczną wartość wynagrodzenia i przekaże je do przetwarzania. Może to być używane do poprawienie wydajności zarówno SQL pushback, jak i wydajności SPSS Modeler .
  • Optymalizacja wykonania składni. Ta metoda ponownego zapisywania przepływu zwiększa wydajność operacji, które zawierają więcej niż jeden węzeł zawierający składnię SPSS Statistics . Optymalizacja odbywa się przez połączenie komend w pojedynczą operację zamiast uruchomienia każdej z nich jako osobnej operacji.
  • Optymalizuj inne wykonanie. Ta metoda ponownego zapisywania przepływu zwiększa wydajność operacji, które nie mogą być delegowane do bazy danych. Optymalizacja jest osiągana przez zmniejszenie ilości danych w przepływie tak wcześnie, jak to możliwe. Podczas utrzymywania integralności danych przepływ jest przepisany w celu przybliżenia operacji do źródła danych, zmniejszając w ten sposób dane dotyczące kosztownych operacji, takich jak łączenia.
  • Włącz przetwarzanie równoległe. W przypadku korzystania z komputera wieloprocesorowego opcja ta pozwala na zrównoważenie obciążenia tych procesorów, co może skutkować jego szybszym działaniem. Przetwarzanie równoległe może okazać się korzystne w przypadku używania wielu węzłów lub używania następujących pojedynczych węzłów: C5.0, Łączenie (wg klucza), Sortowanie, Kategoria (metody rangi i N-tyla) oraz Agregacja (z użyciem jednej lub większej liczby zmiennych kluczowych).
  • Generowanie instrukcji SQL. Ta opcja powoduje, że przetwarzanie SQL jest wymagane z powrotem do bazy danych. Należy zwrócić uwagę, że włączenie lub wyłączenie tej opcji dotyczy tylko nowych przepływów tworzonych przez użytkownika. Nie można przełączyć ustawienia dla istniejącego przepływu. Więcej informacji na temat korzystania z tej opcji z przepływami znajduje się w sekcji Optymalizacja SQL.
    • Buforowanie bazy danych (tylko SQL). W przypadku przepływów, które generują instrukcje SQL, które mają być uruchamiane w bazie danych, dane mogą być buforowane w pamięci podręcznej do tymczasowej tabeli w bazie danych, a nie do systemu plików. W przypadku połączenia z optymalizacją SQL może to skutkować znaczącymi korzyściami, jeśli chodzi o wydajność. Na przykład dane wyjściowe z przepływu, które scala wiele tabel w celu utworzenia widoku eksploracji danych, mogą być buforowane i ponownie wykorzystywane zgodnie z potrzebami. Jeśli buforowanie bazy danych jest włączone, po prostu kliknij prawym przyciskiem myszy dowolny węzeł niekońcowy, aby buforować dane w tym punkcie, a pamięć podręczna jest automatycznie tworzona bezpośrednio w bazie danych przy następnym uruchomieniu przepływu. Umożliwia to wygenerowanie kodu SQL dla wszystkich kolejnych węzłów, co dodatkowo zwiększa wydajność. Alternatywnie tę opcję można w razie potrzeby wyłączyć — na przykład w sytuacji, gdy polityki lub uprawnienia wykluczają zapisywanie danych w bazie danych. Jeśli nie włączono buforowania bazy danych lub optymalizacji SQL, wówczas pamięć podręczna zostanie zapisana w systemie plików.
    • Użyj zrelaksowanej konwersji (tylko SQL). Ta opcja umożliwia przekształcenie danych z łańcuchów na liczby lub z liczb na łańcuchy, o ile są one zapisywane w odpowiednim formacie. Na przykład, jeśli dane są przechowywane w bazie danych jako łańcuchy, lecz w rzeczywistości zawierają znaczącą liczbę, wówczas można przekształcić je w celu ich wykorzystania podczas wstawiania do kolejki.
Rejestrowanie
  • Wyświetl kod SQL w dzienniku komunikatów w czasie wykonywania. Określa, czy kod SQL generowany podczas działania przepływu jest przekazywany do dziennika komunikatów.
  • Wyświetl generowanie kodu SQL w dzienniku komunikatów podczas przygotowywania. Podczas podglądu przepływu określa, czy podgląd kodu SQL, który zostałby wygenerowany, jest przekazywany do dziennika komunikatów.
  • Format SQL Określa, czy dowolny kod SQL wyświetlany w dzienniku powinien zawierać rodzime funkcje SQL, czy standardowe funkcje ODBC formularza {fn FUNC(…)}, wygenerowane przez program SPSS Modeler. Działanie drugiej opcji opiera się na funkcjach sterownika ODBC, które mogły nie zostać zaimplementowane.
  • Reformatuj kod SQL w celu zwiększenia czytelności. Określa, czy kod SQL wyświetlany w dzienniku będzie sformatowany w celu zwiększenia jego czytelności.
  • Pokaż status rekordów. Określa, kiedy należy zgłaszać rekordy wpływające do węzłów końcowych. Określ liczbę, która ma być używana do aktualizowania statusu co N rekordów.

Parametry

Istnieje możliwość zdefiniowania parametrów do użycia w wyrażeniach CLEM oraz w skryptach. Działają one jako zmienne zdefiniowane przez użytkownika, które są zapisywane i utrwalane przy użyciu bieżącego przepływu, sesji lub SuperNodei mogą być dostępne z poziomu interfejsu użytkownika lub za pomocą skryptów. W przypadku zapisania przepływu, na przykład, wszystkie parametry ustawione dla tego przepływu są również zapisywane. (To odróżnia je od lokalnych zmiennych skryptu, które mogą być używane tylko w skrypcie, w którym zostały zadeklarowane). Parametry są często używane w skryptach do sterowania zachowaniem skryptu, poprzez dostarczanie informacji o polach i wartościach, które nie muszą być zakodowane w skrypcie.

Jeśli w tym miejscu zostanie ustawiony parametr we właściwościach przepływu, będzie on dostępny dla wszystkich węzłów w przepływie. Kliknij opcję Dodaj wartość i wprowadź następujące informacje.

Nazwa
Nazwy parametrów wymieniono tutaj. Na przykład, aby utworzyć parametr dla temperatury minimalnej, można wpisać: minvalue. Nie należy uwzględniać przedrostka $P- , który oznacza parametr w wyrażeniach CLEM. Ta nazwa określa sposób, w jaki parametr jest przywoływany w wyrażeniach.
Etykieta
Wyświetla opisową nazwę dla każdego utworzonego parametru.
Pamięć masowa
Umożliwia wybór typu składowania z listy. Składowanie wskazuje, w jaki sposób wartości danych są składowane w parametrze. Na przykład podczas pracy z wartościami zawierającymi zera wiodące, które mają zostać zachowane (na przykład 008), należy wybrać Łańcuch jako typ pamięci masowej. W przeciwnym wypadku zera zostaną odrzucone. Dostępne typy składowania to: łańcuch, liczba całkowita, liczba rzeczywista, czas, data oraz znacznik czasu. Wartości parametrów daty muszą być określone w notacji standardowej ISO (RRRR-MM-DD).
Wartość
Zawiera listę bieżących wartości dla każdego parametru. Parametr należy dostosować odpowiednio do potrzeb. Wartości parametrów daty muszą być określone w notacji standardowej ISO (RRRR-MM-DD). Daty określone w innych formatach nie są akceptowane.
Pomiar
Wybierz poziom pomiaru, który jest używany do opisywania parametrów parametru.
Pytanie
Wybierz tę opcję, jeśli chcesz, aby użytkownik był proszony o wprowadzenie wartości dla tego parametru.

Globalne

Na karcie Globale właściwości przepływu można wyświetlić wartości globalne ustawione dla bieżącego przepływu. Wartości globalne są tworzone za pomocą węzła ustawień globalnych i służą do określania statystyk, takich jak średnia, suma i odchylenie standardowe wybranych zmiennych.

Po uruchomieniu węzła zestawu Globals wartości te są następnie dostępne dla różnych zastosowań w operacjach przepływu.

Nie można edytować wartości globalnych w tabeli w tym miejscu we właściwościach przepływu, ale można wyczyścić wszystkie wartości globalne dla przepływu za pomocą przycisku po prawej stronie tabeli.

Komunikaty

Na karcie Komunikaty we właściwościach przepływu można łatwo wyświetlać komunikaty dotyczące operacji przepływu, takie jak uruchamianie, optymalizacja i czas, jaki upłynął na potrzeby budowania modelu i wartościowania. W tej samej tabeli są również wyświetlane komunikaty o błędach.

Adnotacje

Jeśli konieczne jest opisanie przepływu do innych osób w organizacji, można dołączyć komentarze wyjaśniające do przepływów, węzłów i modeli użytkowych. Inni mogą wtedy wyświetlać te komentarze na ekranie lub nawet wydrukować obraz przepływu, który zawiera komentarze.

Za pomocą karty Adnotacje właściwości przepływu można dodawać adnotacje tekstowe do przepływu. Te uwagi są widoczne tylko wtedy, gdy otwarta jest karta Adnotacje , z tą różnicą, że adnotacje przepływu mogą być również wyświetlane jako komentarze na ekranie.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more