0 / 0
Go back to the English version of the documentation
Nastavení vlastností pro toky
Last updated: 22. 9. 2023
Nastavení vlastností pro toky produktu SPSS Modeler

Můžete určit vlastnosti, které mají být použity pro aktuální tok.

Chcete-li nastavit vlastnosti toku, klepněte na ikonu Vlastnosti toku :
Ikona vlastností toku

K dispozici jsou následující vlastnosti.

Volby

Obecné
  • Maximální počet řádků, které se mají zobrazit v náhledu dat. Určete počet řádků, které mají být zobrazeny, když je požadován náhled dat pro uzel.
  • Omezit členy pro nominální pole. Vyberte tuto volbu a zadejte maximální počet členů pro nominální (nastavená) pole, po jejichž uplynutí se datový typ pole stane Nejmenné. Tato volba je užitečná při práci s velkými nominálními poli. Je-li však úroveň měření pole nastavena na hodnotu Typless, je její role automaticky nastavena na hodnotu Žádná. To znamená, že pole nejsou k dispozici pro modelování.
  • Obnovit zdrojové uzly při provedení. Vyberte tuto volbu, chcete-li při spuštění aktuálního toku automaticky aktualizovat všechny zdrojové uzly zdroje (importu). Tato akce je analogická klepnutí na tlačítko Obnovit ve vlastnostech uzlu importu s tím rozdílem, že tato volba automaticky obnovuje všechny uzly importu (kromě vstupních uzlů uživatele) pro aktuální tok.
Datum/čas
  • Importovat datum/čas jako. Vyberte, zda se má použít úložiště datum/čas pro pole datum/čas nebo zda je importovat jako řetězcové proměnné.
  • Formát data. Vyberte formát data, který má být použit pro pole datového úložiště, nebo jsou-li řetězce interpretovány jako data podle funkcí data CLEM.
  • Formát času. Vyberte formát času, který se má použít pro časová pole úložiště nebo jsou-li řetězce interpretovány jako časy časovými funkcemi produktu CLEM.
  • Přetočení dnů/min. Pro časové formáty vyberte, zda jsou negativní časové rozdíly interpretovány jako odkazy na předchozí den nebo hodinu.
  • Úroveň baseline data (1st Jan). Vyberte základní roky (vždy 1. leden), které mají být použity funkcemi data CLEM, které pracují s jedním datem.
  • 2-číselná data začínají od. Uveďte rok uzavření k přidání číslic století pro roky, které jsou označeny pouze dvěma číslicemi. Např. uvedení roku 1930 jako uzavření roku předpokládá, že v roce 2002 je 05/11/02. Stejné nastavení použije pro data po 30. století 20th ; proto se předpokládá, že se v roce 1973 předpokládá 05/11/73.
  • Časové pásmo. Vyberte, jak se zvolí časové pásmo pro použití s výrazem datetime_now CLEM.
    • Vyberete-li volbu Server, použije se časové pásmo od spuštění běhové komponenty produktu SPSS Modeler (v některých případech se může jednat o stejnou hodnotu jako u volby Klient ). Nebo pokud tok používá data z databáze a podporovaná databáze používá SQL pushback, bude výraz datetime_now používat čas databáze.
    • Vyberete-li volbu Klient, použije se časové pásmo z počítače, kde je nainstalován produkt SPSS Modeler .
    • Případně můžete vybrat libovolné hodnoty koordinovaného univerzálního času pro časové pásmo.
formáty čísel
Pro standardní, vědecké a formáty zobrazení měn zadejte počet desetinných míst, které se mají použít při zobrazování reálných čísel.
Optimalizace
Tato nastavení můžete použít k optimalizaci výkonu toku.
  • Povolit přepisování toku. Vyberte tuto volbu, chcete-li povolit přepisování toku. Přepisování toku změní uspořádání uzlů v toku za scénami pro efektivnější operaci, aniž by došlo ke změně sémantiky toku.
  • Optimalizujte výrazy CLEM. Tato volba umožňuje optimalizátoru vyhledat výrazy CLEM, které lze před spuštěním toku předzpracovat, aby se zvýšila rychlost zpracování. Jako jednoduchý příklad, pokud máte výraz jako např. log(salary), vypočítá optimalizátor skutečnou hodnotu platu a předá ji ke zpracování. To lze použít ke zlepšení výkonu SQL na nižší úrovni a výkonu SPSS Modeler .
  • Optimalizujte provádění syntaxe. Tato metoda přepisování toku zvyšuje účinnost operací, které obsahují více než jeden uzel obsahující syntaxi SPSS Statistics . Optimalizace je dosažena kombinováním příkazů syntaxe do jediné operace namísto toho, aby se spouštěly jako oddělené operace.
  • Optimalizujte jiné provedení. Tato metoda přepisování toku zvyšuje efektivitu operací, které nelze přenést do databáze. Optimalizace se dosáhne snížením množství dat v toku tak brzy, jak je to možné. Při zachování integrity dat je tok přepsán tak, aby se operace posunovala o operace blíže ke zdroji dat, čímž se snížila data ve směru toku dat pro nákladné operace, jako je například spojení typu join.
  • Povolit paralelní zpracování. Je-li tato volba spuštěna na počítači s více procesory, umožňuje systému vyvážit zatížení mezi těmito procesory, což může vést k rychlejšímu výkonu. Použití více uzlů nebo použití následujících jednotlivých uzlů může využívat paralelní zpracování: C5.0, Merge (podle klíče), Třídění, Přihrádka (pořadí dat a dlaždic) a Agregovat (pomocí jednoho nebo více klíčových polí).
  • Generovat SQL. Tato volba odesílá zpracování SQL zpět do databáze. Všimněte si, že zapnutí nebo vypnutí této volby ovlivní pouze ty nové toky, které vytvoříte. Nastavení pro existující tok nelze přepnout. Další informace o použití této volby s toky naleznete v tématu Optimalizace příkazů SQL.
    • Ukládání do mezipaměti databáze (pouze SQL). V případě toků, které generují kód SQL pro spuštění v databázi, mohou být data ukládána do dočasné tabulky v databázi do dočasné tabulky namísto do systému souborů. Je-li kombinovaná s optimalizací SQL, může to mít za následek významné zvýšení výkonu. Například výstup z toku, který sloučí více tabulek za účelem vytvoření zobrazení pro dolování dat, může být uložen do mezipaměti a znovu použit podle potřeby. Je-li povoleno ukládání do mezipaměti databáze, stačí klepnout pravým tlačítkem myši na libovolný nekoncový uzel, aby se data v tomto okamžiku ukládat do mezipaměti, a mezipaměť je automaticky vytvořena přímo v databázi při příštím spuštění toku. To umožňuje generování SQL pro následné uzly, dále zlepšení výkonu. Alternativně lze tuto volbu v případě potřeby zakázat, například když zásady nebo oprávnění zabraňují, aby byla data zapsána do databáze. Není-li ukládání databáze do mezipaměti nebo optimalizace SQL povolena, mezipaměť bude místo toho zapsána do systému souborů.
    • Používejte uvolněný převod (pouze SQL). Tato volba umožňuje převod dat z řetězců na čísla nebo čísel na řetězce, je-li uloženo ve vhodném formátu. Pokud jsou například data uchována v databázi jako řetězec, ale ve skutečnosti obsahují smysluplné číslo, lze data převést pro použití, když dojde k návratu na předchozí úroveň.
Protokolování
  • Zobrazit SQL v protokolu zpráv za běhu programu. Uvádí, zda SQL generovaný při spuštění toku je předán do protokolu zpráv.
  • Zobrazit generování SQL v protokolu zpráv během přípravy. Během náhledu toku určuje, zda má být generován náhled kódu SQL, který má být generován, do protokolu zpráv.
  • Formát SQL Uvádí, zda jakýkoli kód SQL zobrazený v protokolu by měl obsahovat nativní funkce SQL nebo standardní funkce ODBC ve formuláři {fn FUNC(…)}, jak je generováno produktem SPSS Modeler. První z nich spoléhá na funkčnost ovladače ODBC , která není možná implementována.
  • Přeformátovat kód SQL pro lepší čitelnost. Uvádí, zda SQL zobrazený v protokolu má být formátováno pro čitelnost.
  • Zobrazit stav pro záznamy. Uvádí, kdy by se měly hlásit záznamy, když dorazí na uzly terminálu. Uveďte číslo, které se má použít pro aktualizaci stavu všech záznamů N .

Parametry

Parametry můžete definovat pro použití ve výrazech CLEM a ve skriptování. Funují jako uživatelsky definované proměnné, které jsou uloženy a uchovány s aktuálním tokem, relací nebo SuperNodea lze k nim přistupovat z uživatelského rozhraní nebo pomocí skriptování. Uložíte-li například tok, budou uloženy také všechny parametry nastavené pro daný tok. (To odlišuje od lokálních proměnných skriptu, které lze použít pouze ve skriptu, ve kterém jsou deklarovány.) Parametry se často používají při tvoření skriptů k řízení chování skriptu tím, že poskytují informace o polích a hodnotách, které nemusí být ve skriptu pevně naprogramovány.

Pokud zde nastavíte parametr v rámci vlastností toku, bude k dispozici pro všechny uzly v toku. Klepněte na volbu Přidat hodnotu a zadejte následující informace.

Název
Názvy parametrů jsou uvedeny zde. Chcete-li například vytvořit parametr pro minimální teplotu, můžete zadat minvalue. Nezahrnujte předponu $P- , která označuje parametr ve výrazech CLEM. Tento název je to, jak se parametr odkazuje ve výrazech.
Popisek
Vypisuje popisný název pro každý vytvořený parametr.
Úložiště
Vyberte typ úložiště ze seznamu. Úložiště označuje, jak jsou datové hodnoty uloženy v parametru. Například při práci s hodnotami obsahujícími vedoucí nuly, které chcete zachovat (jako například 008), byste měli jako typ úložiště vybrat String . Jinak budou nuly z hodnoty odebrány. Dostupné typy úložiště jsou řetězec, celé číslo, reálný čas, čas, datum a časové razítko. Hodnoty pro parametry data musí být uvedeny ve standardní notaci ISO (RRRR-MM-DD).
Hodnota
Vypíše aktuální hodnotu pro každý parametr. Upravte parametr podle potřeby. Hodnoty pro parametry data musí být uvedeny ve standardní notaci ISO (RRRR-MM-DD). Data zadaná v jiných formátech nejsou akceptována.
Ukazatel
Vyberte úroveň měření, která se používá k popisu charakteristik daného parametru.
Příkazový řádek?
Vyberte tuto volbu, chcete-li, aby uživatel byl vyzván k zadání hodnoty pro zadání hodnoty pro tento parametr.

Globální prostředky

Na kartě Globální prostředky ve vlastnostech toku můžete zobrazit globální hodnoty nastavené pro aktuální tok. Globální hodnoty se vytvářejí s použitím uzlu Nastavit globální proměnné k určení statistiky, jako je střední hodnota, součet nebo směrodatná odchylka pro vybraná pole.

Po spuštění uzlu nastavení globálů jsou tyto hodnoty k dispozici pro celou řadu použití v operacích toku.

Globální hodnoty v tabulce zde nemůžete upravovat ve vlastnostech toku, ale můžete vymazat všechny globální hodnoty pro tok pomocí tlačítka vpravo od tabulky.

Zprávy

Na kartě Zprávy v rámci vlastností toku můžete snadno prohlížet zprávy týkající se operací toku, jako je spuštěná, optimalizační a doba, která uplynula pro sestavení a vyhodnocení modelu. Chybové zprávy jsou také hlášeny v této tabulce.

Anotace

Pokud potřebujete popsat tok k ostatním ve vaší organizaci, můžete připojit vysvětlující komentáře k průběvám, uzlům a nugetem modelu. Ostatní pak mohou tyto komentáře zobrazit na obrazovce, nebo můžete dokonce vytisknout obrázek toku, který obsahuje komentáře.

Kartu Anotace ve vlastnostech toku použijte k přidání textových anotací do toku. Tyto poznámky jsou viditelné pouze tehdy, je-li otevřena karta Anotace s tím rozdílem, že anotace toku mohou být také zobrazeny jako komentáře na obrazovce.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more