Datenquellen unterscheiden sich in ihrer Unterstützung der lokalen Statistikerfassung und unterstützen unterschiedliche Spaltenstatistikdaten. Sie unterstützen auch verschiedene Methoden zum Erfassen von Statistikdaten.
- remote-catalog
- Dieser Typ der Statistikerfassung wird nur für virtualisierte Tabellen in fernen Datenquellen unterstützt, die eine lokale Methode der Statistikerfassung unterstützen. Statistiken, die in den Katalogtabellen der entfernten Datenquelle gespeichert sind, werden abgerufen und dann im Statistikkatalog Data Virtualization gespeichert.Es ist wichtig sicherzustellen, dass genaue Statistikdaten in der fernen Datenquelle verfügbar sind. Der remote-catalog-Typ der Statistikerfassung wird für gruppierte Tabellen nicht unterstützt.
Die folgende Tabelle enthält die Datenquellen, die die lokale Statistikerfassung unterstützen, und zeigt, welche Spaltenstatistiken verfügbar sind.
Datenquelle | Basisstatistik verfügbar | Unterstützung remote-catalog
|
Unterstützung remote-query
|
---|---|---|---|
Amazon Redshift | KARTE, COLCARD, NUMNULLS | ✓ | ✓ |
Amazon S3 | Siehe Statistikdaten für Daten im Objektspeicher erfassen. | Nein | ✓ |
Ceph® | Siehe Statistikdaten für Daten im Objektspeicher erfassen. | Nein | ✓ |
Cloudera Impala | CARD, COLCARD, NUMNULLS. Aktuelle Versionen von Impala (1.4 und höher) erfassen NUMNULLS nicht. | ✓ | ✓ |
Databases for PostgreSQL | KARTE, COLCARD, NUMNULLS | ✓ | ✓ |
Db2® | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 Big SQL | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 for z/OS | CARD, COLCARD, HIGH2KEY, LOW2KEY | ✓ | ✓ |
Db2 on Cloud | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Generisches S3 | Siehe Statistikdaten für Daten im Objektspeicher erfassen. | Nein | ✓ |
Greenplum | KARTE, COLCARD, NUMNULLS | ✓ | ✓ |
Hive | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ (Nicht empfohlen)
|
✓ |
IBM® Cloud Object Storage | Siehe Statistikdaten für Daten im Objektspeicher erfassen. | Nein | ✓ |
Informix | KARTE, COLCARD | ✓ | ✓ |
MariaDB | CARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Microsoft SQL Server | KARTE, COLCARD | ✓ | ✓ |
MySQL | KARTE, COLCARD | ✓ | ✓ |
Netezza Performance Server | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Oracle | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
SAP ASE | KARTE | ✓ | ✓ |
SAP HANA | KARTE, COLCARD | ✓ | ✓ |
Snowflake | KARTE | ✓ | ✓ |
Teradata | KARTE, COLCARD, NUMNULLS | ✓ | ✓ |
Amazon Redshift
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu Amazon Redshift beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Amazon Redshift unterstützt die Statistik HIGH2KEY oder LOW2KEY nicht. Außerdem erfasst der Befehl ANALYZE keine Statistikdaten für CHAR-und NCHAR-Spaltendaten, wenn die Länge der Spaltendaten 1020 Byte überschreitet. Wenn eine Spalte nur Nullwerte enthält, werden keine Spaltenstatistikdaten erfasst.
Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Statistikerfassungstyp remote-query . Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Cloudera Impala
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung COMPUTE STATS , wie in der Cloudera Impala -Produktdokumentation beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Cloudera Impala unterstützt die Statistik HIGH2KEY oder LOW2KEY nicht und neuere Versionen von Impala unterstützen die Statistik NUMNULLS nicht. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Datenbanken für PostgreSQL
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu PostgreSQL beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
PostgreSQL unterstützt die Statistik HIGH2KEY oder LOW2KEY nicht. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Db2 und Db2 on Cloud
Verwenden Sie den Befehl RUNSTATS , um Statistikdaten für lokale Tabellen für diese Datenquellen zu erfassen. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden. Bei diesem Typ werden die Werte für HIGH2KEY und LOW2KEY (die den zweithöchsten und zweithöchsten Wert in der Tabelle darstellen) aus dem Db2 -Katalog kopiert. Beim Typ remote-query stellen die Werte für HIGH2KEY und LOW2KEY die höchsten und niedrigsten Werte in der Tabelle dar.
Db2 Big SQL
Verwenden Sie zum Erfassen von Statistikdaten für lokale Tabellen den Befehl ANALYZE . Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden. Bei beiden Typen stellen die Werte für HIGH2KEY und LOW2KEY die höchsten und niedrigsten Werte in der Tabelle dar.
Db2 for z/OS
Verwenden Sie zum Erfassen von Statistikdaten für lokale Tabellen den Befehl RUNSTATS . Für LOB-Typen werden keine Statistikdaten erfasst. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden. Bei dieser Methode werden die Werte HIGH2KEY und LOW2KEY (die den zweithöchsten und zweithöchsten Wert in der Tabelle darstellen) aus dem Db2 -Katalog kopiert. Beim Erfassungstyp remote-query stellen die Werte für HIGH2KEY und LOW2KEY die höchsten und niedrigsten Werte in der Tabelle dar.
Db2 for z/OS® unterstützt die NUMNULLS-Statistik nicht. Wenn Ihre Abfragen von dieser Statistik profitieren würden, verwenden Sie den Statistikerfassungstyp remote-query . Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Greenplum
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu Greenplum beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Greenplum unterstützt die Statistik HIGH2KEY oder LOW2KEY nicht. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Hive
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu Hive beschrieben. Der Typ der remote-catalog -Statistikerfassung in Hive wird aufgrund bekannter Probleme bei der Statistikerfassung in Hive nicht empfohlen. Verwenden Sie stattdessen den Statistikerfassungstyp remote-query . Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Informix
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung UPDATE STATISTICS , wie in der Informix® -Produktdokumentation beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Informix unterstützt die Statistik HIGH2KEY, LOW2KEYoder NUMNULLS nicht. Sie erfasst nur CARD (Tabellenkardinalität) und COLCARD (Spaltenkardinalität). Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ remote-query Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
MariaDB
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu MariaDB beschrieben. Statistikdaten für Spalten des Typs TEXT oder BLOB werden nicht erfasst. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden. Sie müssen über Administratorberechtigungen für den Zugriff auf Katalogstatistikdaten verfügen. Dies ist erforderlich, wenn Sie den Statistikerfassungstyp remote-catalog verwenden.
MariaDB unterstützt die Statistik COLCARD nicht. Wenn Ihre Abfragen von dieser Statistik profitieren würden, verwenden Sie den Statistikerfassungstyp remote-query . Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Microsoft SQL Server
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung UPDATE STATISTICS , wie in der Microsoft SQL Server -Produktdokumentation beschrieben. Statistikdaten für Spalten des Typs XML werden nicht erfasst. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Microsoft SQL Server erfasst nur CARD (Tabellenkardinalität) und COLCARD (Spaltenkardinalität). Die Statistik HIGH2KEY, LOW2KEYoder NUMNULLS wird nicht unterstützt. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
MySQL
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung ANALYZE TABLE , wie in der MySQL -Produktdokumentation beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
MySQL erfasst nur CARD (Tabellenkardinalität) und COLCARD (Spaltenkardinalität). Die Statistik HIGH2KEY, LOW2KEYoder NUMNULLS wird nicht unterstützt. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Netezza Performance Server
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl GENERATE STATISTICS , wie in der Produktdokumentation zu Netezza® beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden. Bei beiden Typen stellen die Werte für HIGH2KEY und LOW2KEY die höchsten und niedrigsten Werte in der Tabelle dar.
Oracle
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl ANALYZE , wie in der Produktdokumentation zu Oracle beschrieben. Alternativ können Sie Statistikdaten mithilfe der Prozedur DBms_STATS.GATHER_TABLE_STATS erfassen. Sie können die automatische Statistikerfassung auch in der fernen Oracle -Datenquelle konfigurieren. Für LOB-Typen werden keine Statistikdaten erfasst. Es hat sich bewährt, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Typ der Statistikerfassung remote-catalog zu verwenden. Bei beiden Typen stellen die Werte für HIGH2KEY und LOW2KEY die höchsten und niedrigsten Werte in der Tabelle dar.
SAP ASE
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung UPDATE STATISTICS , wie in der SAP ASE -Produktdokumentation beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
SAP ASE erfasst nur CARD (Tabellenkardinalität). Die Statistik COLCARD, HIGH2KEY, LOW2KEYoder NUMNULLS wird nicht unterstützt. Verwenden Sie den Statistikerfassungstyp remote-query für Schlüsselspalten, die in Vergleichselementen verwendet werden. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
SAP HANA
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie die Anweisung CREATE STATISTICS ON , wie in der SAP HANA -Produktdokumentation beschrieben. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
SAP HANA erfasst nur CARD (Tabellenkardinalität) und COLCARD (Spaltenkardinalität). Die Statistik HIGH2KEY, LOW2KEYoder NUMNULLS wird nicht unterstützt. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Snowflake
Snowflake unterstützt keine explizite Methode zum Erfassen von Statistikdaten. Die Spalte ROW_COUNT in der Katalogtabelle INFORMATION_SCHEMA.TABLES speichert jedoch den Wert der Tabellenkardinalität (CARD) als Teil der Data Virtualization. Es ist ein bewährtes Verfahren, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Statistikerfassungstyp remote-catalog zu verwenden.
Snowflake erfasst nur CARD (Tabellenkardinalität). Die Statistik COLCARD, HIGH2KEY, LOW2KEYoder NUMNULLS wird nicht unterstützt. Verwenden Sie den Statistikerfassungstyp remote-query für Schlüsselspalten, die in Vergleichselementen verwendet werden. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
Teradata
Zum Erfassen von Statistikdaten für lokale Tabellen verwenden Sie den Befehl COLLECT STATISTICS , wie in der Produktdokumentation zu Teradata beschrieben. Geben Sie die Option THRESHOLD an, um eine redundante Statistikerfassung zu verhindern. Wenn bei dieser Option das Datenvolumen, das sich seit der letzten Statistikerfassung geändert hat, unter einem angegebenen Schwellenwert liegt oder die Statistikdaten neuer als ein angegebenes Alter sind, erfasst Teradata die Statistikdaten nicht erneut. Statistikdaten werden nicht für den Typ PERIOD (mit Ausnahme der Ausdrücke BEGIN und END), den Typ XML, BLOB oder CLOB oder einen benutzerdefinierten Typ (außer einem geografisch-räumlichen Typ) erfasst. Es hat sich bewährt, sicherzustellen, dass Statistikdaten in der fernen Datenquelle erfasst werden, und den Typ der Statistikerfassung remote-catalog zu verwenden.
Teradata unterstützt die Statistik HIGH2KEY oder LOW2KEY nicht. Wenn Ihre Abfragen von diesen Statistikdaten profitieren würden, verwenden Sie den Typ der remote-query -Statistikerfassung. Dieser Typ kann ressourcenintensiv sein und viel Zeit in Anspruch nehmen, wenn die virtualisierte Tabelle viele Zeilen enthält oder für viele Spalten Statistikdaten erfasst werden. Ziehen Sie die Erfassung von Statistikdaten in Betracht, wenn das System weniger ausgelastet ist. Vermeiden Sie es, viele Statistikerfassungsjobs gleichzeitig zu planen.
IBM Cloud Object Storage, Amazon S3, Ceph, oder generische S3 -Datenquellen
Verwenden Sie den Befehl ANALYZE , um Statistiken zu virtualisierten Tabellen in IBM Cloud Object Storage-, Amazon S3-, Ceph- oder generischen S3 -Datenquellen zu erfassen.
Wenn die Tabelle ein großes Datenvolumen enthält, geben Sie die Option TABLESAMPLE an, um Statistikdaten für eine Untergruppe der Daten zu erfassen, sodass die Analyseoperation früher ausgeführt werden kann.
Siehe auch Statistikdaten für Daten im Objektspeicher erfassen.