0 / 0
Go back to the English version of the documentation
Omezení pro shromažďování statistiky v produktu Watson Query
Last updated: 28. 4. 2023
Omezení specifická pro zdroj dat pro shromažďování statistiky v produktu Watson Query

Zdroje dat se liší ve své podpoře shromažďování lokálních statistik a podporují různé statistiky sloupců. Podpoňují také různé metody shromažďování statistických údajů.

Watson Query podporuje dva typy kolekcí statistiky.
remote-catalog
Tento typ shromažďování statistických údajů je podporován pouze pro virtualizované tabulky ve vzdálených zdrojích dat, které podporují lokální metodu shromažďování statistických údajů. Statistiky, které jsou uloženy v tabulkách katalogu na vzdáleném zdroji dat, se načtou a pak uloží do katalogu statistiky Watson Query . Je důležité zajistit, aby byly ve vzdáleném zdroji dat k dispozici přesné statistiky. Typ remote-catalog kolekce statistik není podporován pro seskupené tabulky.
remote-query
Tento typ kolekce statistik používá dotazy SQL pro virtualizovanou tabulku k výpočtu statistiky. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců.

V následující tabulce jsou uvedeny zdroje dat, které podporují lokální shromažďování statistických údajů a zobrazují, které statistiky sloupců jsou k dispozici.

Zdroj dat Základní dostupné statistiky Podporuje
remote-catalog
Podporuje
remote-query
Amazon Redshift KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL
Cloudera Impala KARTA, ČIPOVÁ KARTA, NULOVÝCH TRUPŮ. Poslední verze produktu Impala (1.4 a vyšší) neshromažďují NUMNULLS.
Databases for PostgreSQL KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL
Db2® KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 Big SQL KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 for z/OS CARD, COLCARD, HIGH2KEY, LOW2KEY
Db2 on Cloud KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Greenplum KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL
Hive KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
(Nedoporučuje se)
Informix KARTA, KOKARTIČKA
MariaDB CARD, HIGH2KEY, LOW2KEY, NUMNULLS
Microsoft SQL Server KARTA, KOKARTIČKA
MySQL KARTA, KOKARTIČKA
Netezza Performance Server KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Oracle KARTA, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
SAP ASE Karta
SAP HANA KARTA, KOKARTIČKA
Snowflake Karta
Teradata KARTA, ČIPOVÁ KARTA, NULOVÝCH HODNOT NULL
Zdroje datIBM Cloud Object Storage, Amazon S3nebo Ceph dat Viz Shromažďování statistiky pro data v úložišti objektů.  
Prosté soubory, které nejsou v úložišti objektů Viz Shromažďování statistik pro nestrukturované soubory, které nejsou v úložišti objektů.  
Všechny ostatní podporované zdroje dat Viz Shromažďování statistik pro všechny ostatní zdroje dat. Nepodporováno

Amazon Redshift

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Amazon Redshift . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Amazon Redshift nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Příkaz ANALYZE také neshromažďuje statistické údaje o datových sloupcích typu CHAR a NCHAR, pokud délka dat sloupce přesahuje 1020 bajtů. Pokud sloupec obsahuje pouze hodnoty NULL, statistika sloupců se neshromažďuje.

Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Cloudera Impala

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz COMPUTE STATS , jak je popsáno v dokumentaci produktu Cloudera Impala . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Cloudera Impala nepodporuje statistiku HIGH2KEY nebo LOW2KEY a novější verze produktu Impala nepodporují statistiku NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Databáze pro produkt PostgreSQL

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci k produktu PostgreSQL . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

PostgreSQL nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Db2 a Db2 on Cloud

Chcete-li shromažďovat statistiku lokální tabulky pro tyto zdroje dat, použijte příkaz RUNSTATS . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . Při použití tohoto typu jsou hodnoty HIGH2KEY a LOW2KEY (představující druhé nejvyšší a druhé nejnižší hodnoty v tabulce) zkopírovány z katalogu Db2 . V případě typu remote-query představují hodnoty HIGH2KEY a LOW2KEY nejvyšší a nejnižší hodnoty v tabulce.

Db2 Big SQL

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.

Db2 for z/OS

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz RUNSTATS . Pro typy objektů LOB nejsou shromažďovány statistické údaje. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S touto metodou jsou hodnoty HIGH2KEY a LOW2KEY (představující druhou nejvyšší a druhou nejnižší hodnotu v tabulce) zkopírovány z katalogu Db2 . S typem kolekce remote-query představují hodnoty HIGH2KEY a LOW2KEY nejvyšší a nejnižší hodnoty v tabulce.

Db2 for z/OS® nepodporuje statistiku NUMNULLS. Pokud by vaše dotazy měly prospěch z této statistiky, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Greenplum

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Greenplum . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Greenplum nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Hive

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci k produktu Hive . Typ kolekce statistiky remote-catalog v souboru Hive se nedoporučuje kvůli známým problémům se shromažďováním statistických údajů v souboru Hive. Použijte místo toho typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Pro shromažďování statistických údajů o sloupcích, které jsou definovány s komplexními typy, jako je typ UNION, není žádná podpora.

Informix

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS , jak je popsáno v dokumentaci produktu Informix® . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Informix nepodporuje statistiku HIGH2KEY, LOW2KEYnebo NUMNULLS. Shromažďuje pouze CARD (kardinalita tabulky) a COLCARD (kardinalita sloupce). Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query .. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

MariaDB

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE , jak je popsáno v dokumentaci produktu MariaDB . Statistiky pro typ TEXT nebo sloupce typu BLOB se neshromažďují. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . Chcete-li přistupovat ke statistice katalogu, která je vyžadována při použití typu kolekce statistik produktu remote-catalog , musíte mít administrativní oprávnění.

MariaDB nepodporuje statistiku COLCARD. Pokud by vaše dotazy měly prospěch z této statistiky, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Microsoft SQL Server

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS , jak je popsáno v dokumentaci k produktu Microsoft SQL Server . Statistiky pro sloupce typu XML se neshromažďují. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Microsoft SQL Server shromažďuje pouze CARD (kardinalitu tabulky) a COLCARD (kardinalita sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

MySQL

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE TABLE , jak je popsáno v dokumentaci k produktu MySQL . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

MySQL shromažďuje pouze CARD (kardinalita tabulky) a COLCARD (kardinalita sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Netezza Performance Server

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz GENERATE STATISTICS , jak je popsáno v dokumentaci k produktu Netezza® . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.

Oracle

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz ANALYZE podle popisu v dokumentaci k produktu Oracle . Další možností je shromažďování statistických údajů s použitím DBMS_STATS.GATHER_TABLE_STATS . Automatické shromažďování statistických údajů lze také konfigurovat ve vzdáleném zdroji dat Oracle . Pro typy objektů LOB nejsou shromažďovány statistické údaje. Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog . S oběma typy hodnoty HIGH2KEY a LOW2KEY představují nejvyšší a nejnižší hodnoty v tabulce.

SAP ASE

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz UPDATE STATISTICS podle popisu v dokumentaci k produktu SAP ASE . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

SAP ASE shromažďuje pouze hodnotu CARD (kardinalita tabulky). Nepodporuje statistiku COLCARD, HIGH2KEY, LOW2KEYnebo NUMNULLS. Použijte typ kolekce statistiky remote-query pro sloupce klíče, které se používají v predikátech. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

SAP HANA

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz CREATE STATISTICS ON , jak je popsáno v dokumentaci k produktu SAP HANA . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

SAP HANA shromažďuje pouze CARD (kardinalitu tabulky) a COLCARD (kardinalitu sloupce). Nepodporuje statistické údaje HIGH2KEY, LOW2KEYnebo NUMNULLS. Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Snowflake

Snowflake nepodporuje explicitní metodu shromažďování statistických údajů. Sloupec ROW_COUNT je však ve sloupci INFORMATION_SCHEMA.TABLES tabulka katalogu ukládá hodnotu kardinality tabulky (CARD) jako součást kolekce statistik produktu Watson Query . Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Snowflake shromažďuje pouze CARD (kardinalitu tabulky). Nepodporuje statistiku COLCARD, HIGH2KEY, LOW2KEYnebo NUMNULLS. Použijte typ kolekce statistiky remote-query pro sloupce klíče, které se používají v predikátech. Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Teradata

Chcete-li shromažďovat statistiku lokální tabulky, použijte příkaz COLLECT STATISTICS podle popisu v dokumentaci k produktu Teradata . Zadejte volbu THRESHOLD, abyste se vyvarovali nadbytečnému shromažďování statistiky. Je-li tato volba uvedena, pokud množství dat, která se změnila od posledního shromažďování statistických údajů za určitou prahovou hodnotu, nebo jsou-li statistiky novější než určený věk, Teradata neshromáždí statistiku. Pro typ PERIOD nejsou shromažďovány statistické údaje (kromě výrazů BEGIN a END), typu XML, BLOB nebo CLOB nebo libovolného jiného typu definovaného uživatelem (jiného než geoprostorového typu). Nejlepší postup je zajistit, aby se statistika shromáždila ve vzdáleném zdroji dat a aby používala typ kolekce statistik produktu remote-catalog .

Volba Teradata nepodporuje statistiku HIGH2KEY nebo LOW2KEY . Pokud by vaše dotazy měly prospěch z těchto statistik, použijte typ kolekce statistik produktu remote-query . Tento typ může být náročný na prostředky a dokončení může trvat dlouho, pokud má virtualizovaná tabulka mnoho řádků nebo statistik, které jsou shromažďovány pro mnoho sloupců. Zvažte shromažďování statistických údajů, je-li systém méně vytížený. Vyvarovat se plánování mnoha úloh shromažďování statistiky ve stejnou dobu.

Zdroje dat IBM Cloud Object Storage, Amazon S3nebo Ceph

Chcete-li shromažďovat statistiky o virtualizovaných tabulkách ve zdrojích dat IBM® Cloud Object Storage, Amazon S3nebo Ceph ® , použijte příkaz ANALYZE .

Má-li tabulka velké množství dat, zadejte volbu TABLESAMPLE pro shromažďování statistiky o podmnožině dat, aby mohla být operace analýzy dokončena dříve.

Viz také Shromažďování statistiky pro data v úložišti objektů.

Prosté soubory, které nejsou v úložišti objektů

Chcete-li shromažďovat statistiky o virtualizovaných tabulkách v nestrukturovaných souborech pomocí metody shromažďování statistických údajů založených na datech, použijte příkaz SYSPROC.NNSTAT uložená procedura.

Viz také Shromažďování statistik pro nestrukturované soubory, které nejsou v úložišti objektů.

Všechny ostatní podporované zdroje dat

Chcete-li shromažďovat statistické údaje pro klíčové sloupce predikátů ve virtualizovaných tabulkách přes všechny ostatní zdroje dat, použijte uloženou proceduru COLLECT_STATISTICS v produktu Watson Query.

Typ remote-query je jediný podporovaný typ shromažďování statistických údajů pro tyto zdroje dat.

Viz také Shromažďování statistik pro všechny ostatní zdroje dat.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more