Translation not up to date
Zdroje dat se liší ve své podpoře shromažďování lokálních statistik a podporují různé statistiky sloupců. Podpoňují také různé metody shromažďování statistických údajů.
- remote-catalog
- Tento typ shromažďování statistických údajů je podporován pouze pro virtualizované tabulky ve vzdálených zdrojích dat, které podporují lokální metodu shromažďování statistických údajů. Statistiky, které jsou uloženy v tabulkách katalogu na vzdáleném zdroji dat, se načtou a pak uloží do katalogu statistiky Watson Query . Je důležité zajistit, aby byly ve vzdáleném zdroji dat k dispozici přesné statistiky. Typ remote-catalog kolekce statistik není podporován pro seskupené tabulky.
- remote-query
- Tento typ kolekce statistik používá dotazy SQL pro virtualizovanou tabulku k výpočtu statistiky. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců.
V následující tabulce jsou uvedeny zdroje dat, které podporují lokální shromažďování statistických údajů a zobrazují, které statistiky sloupců jsou k dispozici.
Zdroj dat | Základní dostupné statistiky | Podporuje remote-catalog
|
Podporuje remote-query
|
---|---|---|---|
Amazon Redshift | KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL | ✓ | ✓ |
Cloudera Impala | KARTA, ČIPOVÁ KARTA, NULOVÝCH TRUPŮ. Poslední verze produktu Impala (1.4 a vyšší) neshromažďují NUMNULLS. | ✓ | ✓ |
Databases for PostgreSQL | KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL | ✓ | ✓ |
Db2® | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 Big SQL | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 for z/OS | CARD, COLCARD, HIGH2KEY, LOW2KEY | ✓ | ✓ |
Db2 on Cloud | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Greenplum | KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL | ✓ | ✓ |
Hive | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ (Nedoporučuje se)
|
✓ |
Informix | KARTA, KOKARTIČKA | ✓ | ✓ |
MariaDB | CARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Microsoft SQL Server | KARTA, KOKARTIČKA | ✓ | ✓ |
MySQL | KARTA, KOKARTIČKA | ✓ | ✓ |
Netezza Performance Server | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Oracle | KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
SAP ASE | Karta | ✓ | ✓ |
SAP HANA | KARTA, KOKARTIČKA | ✓ | ✓ |
Snowflake | Karta | ✓ | ✓ |
Teradata | KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL | ✓ | ✓ |
Zdroje datIBM Cloud Object Storage, Amazon S3nebo Ceph dat | Viz Shromažďování statistiky pro data v úložišti objektů. | ✓ | |
Prosté soubory, které nejsou v úložišti objektů | Viz Shromažďování statistik pro nestrukturované soubory, které nejsou v úložišti objektů. | ✓ | |
Všechny ostatní podporované zdroje dat | Viz Shromažďování statistik pro všechny ostatní zdroje dat. | Nepodporováno | ✓ |
Amazon Redshift
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Amazon Redshift . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Amazon Redshift nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Příkaz ANALYZE také neshromažďuje statistické údaje o datových sloupcích typu CHAR a NCHAR, pokud délka dat sloupce přesahuje 1020 bajtů. Pokud sloupec obsahuje pouze hodnoty NULL, statistika sloupců se neshromažďuje.
Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Cloudera Impala
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz COMPUTE STATS , jak je popsáno v dokumentaci produktu Cloudera Impala . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Cloudera Impala nepodporuje statistiku HIGH2KEY nebo LOW2KEY a novější verze produktu Impala nepodporují statistiku NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Databáze pro produkt PostgreSQL
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci k produktu PostgreSQL . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
PostgreSQL nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Db2 a Db2 on Cloud
Chcete-li shromažďovat statistiku lokální tabulky pro tyto zdroje dat, použijte příkaz RUNSTATS . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . Při použití tohoto typu jsou hodnoty HIGH2KEY a LOW2KEY (představující druhé nejvyšší a druhé nejnižší hodnoty v tabulce) zkopírovány z katalogu Db2 . V případě typu remote-query představují hodnoty HIGH2KEY a LOW2KEY nejvyšší a nejnižší hodnoty v tabulce.
Db2 Big SQL
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.
Db2 for z/OS
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz RUNSTATS . Pro typy objektů LOB nejsou shromažďovány statistické údaje. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S touto metodou jsou hodnoty HIGH2KEY a LOW2KEY (představující druhou nejvyšší a druhou nejnižší hodnotu v tabulce) zkopírovány z katalogu Db2 . S typem kolekce remote-query představují hodnoty HIGH2KEY a LOW2KEY nejvyšší a nejnižší hodnoty v tabulce.
Db2 for z/OS® nepodporuje statistiku NUMNULLS. Pokud by vaše dotazy měly prospěch z této statistiky, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Greenplum
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Greenplum . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Greenplum nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Hive
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci k produktu Hive . Typ kolekce statistiky remote-catalog v souboru Hive se nedoporučuje kvůli známým problémům se shromažďováním statistických údajů v souboru Hive. Použijte místo toho typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Pro shromažďování statistických údajů o sloupcích, které jsou definovány s komplexními typy, jako je typ UNION, není žádná podpora.
Informix
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS , jak je popsáno v dokumentaci produktu Informix® . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Informix nepodporuje statistiku HIGH2KEY, LOW2KEYnebo NUMNULLS. Shromažďuje pouze CARD (kardinalita tabulky) a COLCARD (kardinalita sloupce). Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query .. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
MariaDB
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci produktu MariaDB . Statistiky pro typ TEXT nebo sloupce typu BLOB se neshromažďují. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . Chcete-li přistupovat ke statistice katalogu, která je vyžadována při použití typu kolekce statistik produktu remote-catalog , musíte mít administrativní oprávnění.
MariaDB nepodporuje statistiku COLCARD. Pokud by vaše dotazy měly prospěch z této statistiky, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Microsoft SQL Server
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS , jak je popsáno v dokumentaci k produktu Microsoft SQL Server . Statistiky pro sloupce typu XML se neshromažďují. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Microsoft SQL Server shromažďuje pouze CARD (kardinalitu tabulky) a COLCARD (kardinalita sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
MySQL
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE TABLE , jak je popsáno v dokumentaci k produktu MySQL . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
MySQL shromažďuje pouze CARD (kardinalita tabulky) a COLCARD (kardinalita sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Netezza Performance Server
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz GENERATE STATISTICS , jak je popsáno v dokumentaci k produktu Netezza® . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.
Oracle
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Oracle . Další možností je shromažďování statistických údajů s použitím DBMS_STATS.GATHER_TABLE_STATS . Automatické shromažďování statistických údajů lze také konfigurovat ve vzdáleném zdroji dat Oracle . Pro typy objektů LOB nejsou shromažďovány statistické údaje. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.
SAP ASE
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS podle popisu v dokumentaci k produktu SAP ASE . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
SAP ASE shromažďuje pouze hodnotu CARD (kardinalita tabulky). Nepodporuje statistiku COLCARD, HIGH2KEY, LOW2KEYnebo NUMNULLS. Použijte typ kolekce statistiky remote-query pro sloupce klíče, které se používají v predikátech. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
SAP HANA
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz CREATE STATISTICS ON , jak je popsáno v dokumentaci k produktu SAP HANA . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
SAP HANA shromažďuje pouze CARD (kardinalitu tabulky) a COLCARD (kardinalitu sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Snowflake
Snowflake nepodporuje explicitní metodu shromažďování statistických údajů. Sloupec ROW_COUNT je však ve sloupci INFORMATION_SCHEMA.TABLES tabulka katalogu ukládá hodnotu kardinality tabulky (CARD) jako součást kolekce statistik produktu Watson Query . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Snowflake shromažďuje pouze CARD (kardinalitu tabulky). Nepodporuje statistiku COLCARD, HIGH2KEY, LOW2KEYnebo NUMNULLS. Použijte typ kolekce statistiky remote-query pro sloupce klíče, které se používají v predikátech. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Teradata
Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz COLLECT STATISTICS podle popisu v dokumentaci k produktu Teradata . Zadejte volbu THRESHOLD, abyste se vyvarovali nadbytečnému shromažďování statistiky. Je-li tato volba uvedena, pokud množství dat, která se změnila od posledního shromažďování statistických údajů za určitou prahovou hodnotu, nebo jsou-li statistiky novější než určený věk, Teradata neshromáždí statistiku. Pro typ PERIOD nejsou shromažďovány statistické údaje (kromě výrazů BEGIN a END), typu XML, BLOB nebo CLOB nebo libovolného jiného typu definovaného uživatelem (jiného než geoprostorového typu). Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .
Volba Teradata nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.
Zdroje dat IBM Cloud Object Storage, Amazon S3nebo Ceph
Chcete-li shromažďovat statistiky o virtualizovaných tabulkách ve zdrojích dat IBM® Cloud Object Storage, Amazon S3nebo Ceph ® , použijte příkaz ANALYZE .
Má-li tabulka velké množství dat, zadejte volbu TABLESAMPLE pro shromažďování statistiky o podmnožině dat, aby mohla být operace analýzy dokončena dříve.
Viz také Shromažďování statistiky pro data v úložišti objektů.
Prosté soubory, které nejsou v úložišti objektů
Chcete-li shromažďovat statistiky o virtualizovaných tabulkách v nestrukturovaných souborech pomocí metody shromažďování statistických údajů založených na datech, použijte příkaz SYSPROC.NNSTAT uložená procedura.
Viz také Shromažďování statistik pro nestrukturované soubory, které nejsou v úložišti objektů.
Všechny ostatní podporované zdroje dat
Chcete-li shromažďovat statistické údaje pro klíčové sloupce predikátů ve virtualizovaných tabulkách přes všechny ostatní zdroje dat, použijte uloženou proceduru COLLECT_STATISTICS v produktu Watson Query.
Typ remote-query je jediný podporovaný typ shromažďování statistických údajů pro tyto zdroje dat.
Viz také Shromažďování statistik pro všechny ostatní zdroje dat.