Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 12. 1. 2023
Počáteční fragmenty toku vedoucí z uzlů importu dat jsou hlavními cíli pro generování kódu SQL. Je-li nalezen uzel, který nelze kompilovat do SQL, data se extrahují z databáze a provede se následné zpracování.
Během přípravy toku a před spuštěním se proces generování SQL provádí takto:
- Software přeuspořádá toky za účelem přesunu následných uzlů do "zóny SQL", kde je to možné bezpečně provést.
- Při práci z uzlů importu směrem k uzlům terminálu jsou vytvářeny přírůstkově přírůstkové výrazy SQL. Tato fáze se zastaví, když je zjištěn uzel, který nelze převést na SQL, nebo když je uzel terminálu (například uzel tabulky nebo uzel grafu) převeden na SQL. Na konci této fáze je každý uzel označen příkazem SQL, je-li uzel a jeho předchůdci mají ekvivalent SQL.
- Při práci z uzlů s nejsložitějším ekvivalenty SQL zpět směrem k uzlům importu je zkontrolována platnost SQL. Kód SQL, který byl úspěšně ověřen, je vybrán k provedení.
- Uzly, pro které byly všechny operace vygenerovány SQL, jsou zvýrazněny ikonou SQL vedle uzlu na plátně toku. Na základě výsledků můžete případně dále reorganizovat svůj tok, abyste mohli plně využít výhod provedení databáze.
Kde se zlepšení vyskytují?
SQL pushback zlepšuje výkon v řadě datových operací:
- Sloučení (sloučení podle klíče). Operace spojení mohou zvýšit optimalizaci v rámci databází.
- Agregace. Agregace, distribuce a webové uzly používají agregaci k produkci svých výsledků. Souhrnná data používají podstatně menší šířku pásma než původní data.
- Výběr. Výběr záznamů na základě určitých kritérií snižuje množství záznamů.
- Řazení. Řazení záznamů je aktivita náročná na prostředky, která je prováděna efektivněji v databázi.
- Odvození polí. Nová pole se generují efektivněji v databázi.
- Projekce pole. Software extrahuje pouze pole, která jsou nezbytná pro následné zpracování od databáze, která minimalizuje požadavky na šířku pásma a paměť. Totéž platí i pro nadbytečná pole v prostých textových souborech: ačkoli software musí číst nadbytečná pole, nealokuje pro ně žádné úložiště.
- Scoring. SQL lze generovat z rozhodovacích stromů, sad pravidel, lineární regrese a modelů generovaných faktorem.