0 / 0
Torna alla versione inglese della documentazione
Limitazioni per la raccolta di statistiche nella Data Virtualization
Ultimo aggiornamento: 26 nov 2024
Limitazioni specifiche dell'origine dati per la raccolta di statistiche nella Data Virtualization

Le origini dati differiscono nel supporto della raccolta di statistiche locali e supportano statistiche di colonne differenti. Inoltre, supportano diversi metodi di raccolta delle statistiche.

Data Virtualization supporta due tipi di raccolta di statistiche.
remote-catalog
Questo tipo di raccolta statistiche è supportato solo per le tabelle virtualizzate nelle origini dati remote che supportano un metodo locale di raccolta statistiche. Le statistiche memorizzate nelle tabelle del catalogo dell'origine dati remota vengono recuperate e quindi memorizzate nel catalogo delle statistiche Data Virtualization. È fondamentale garantire la disponibilità di statistiche accurate nell'origine dati remota. Il tipo remote-catalog di raccolta statistiche non è supportato per le tabelle raggruppate.

La seguente tabella identifica le origini dati che supportano la raccolta di statistiche locali e mostra quali statistiche di colonna sono disponibili.

Origine dati Statistiche di base disponibili Supporta
remote-catalog
Supporta
remote-query
Amazon Redshift SCHEDA, COLCARD, NUMNULLS
Amazon S3 Consultare Raccolta di statistiche per i dati nell'archivio oggetti. N
Ceph® Consultare Raccolta di statistiche per i dati nell'archivio oggetti. N
Cloudera Impala SCHEDA, COLCARD, NUMNULLS. Le versioni recenti di Impala (1.4 e successive) non raccolgono NUMNULLS.
Databases for PostgreSQL SCHEDA, COLCARD, NUMNULLS
Db2® CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 Big SQL CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 for z/OS CARD, COLCARD, HIGH2KEY, LOW2KEY
Db2 on Cloud CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
S3 generico Consultare Raccolta di statistiche per i dati nell'archivio oggetti. N
Greenplum SCHEDA, COLCARD, NUMNULLS
Hive CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
(Non consigliato)
IBM® Cloud Object Storage Consultare Raccolta di statistiche per i dati nell'archivio oggetti. N
Informix CARD, COLCARD
MariaDB CARD, HIGH2KEY, LOW2KEY, NUMNULLS
Microsoft SQL Server CARD, COLCARD
MySQL CARD, COLCARD
Netezza Performance Server CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Oracle CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
SAP ASE Scheda
SAP HANA CARD, COLCARD
Snowflake Scheda
Teradata SCHEDA, COLCARD, NUMNULLS

Amazon Redshift

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto Amazon Redshift . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Amazon Redshift non supporta la statistica HIGH2KEY o LOW2KEY . Inoltre, il comando ANALYZE non raccoglie le statistiche per i dati della colonna CHAR e NCHAR se la lunghezza dei dati della colonna supera i 1020 byte. Se una colonna contiene solo valori NULL, le statistiche della colonna non vengono raccolte.

Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Cloudera Impala

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione COMPUTE STATS , come descritto nella documentazione di Cloudera Impala . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Cloudera Impala non supporta la statistica HIGH2KEY o LOW2KEY e le versioni più recenti di Impala non supportano la statistica NUMNULLS. Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Database per PostgreSQL

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto PostgreSQL . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

PostgreSQL non supporta la statistica HIGH2KEY o LOW2KEY . Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Db2 e Db2 on Cloud

Per raccogliere le statistiche della tabella locale per queste origini dati, utilizzare il comando RUNSTATS . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. Con questo tipo, i valori HIGH2KEY e LOW2KEY (che rappresentano il secondo valore più alto e il secondo più basso nella tabella) vengono copiati dal catalogo Db2 . Con il tipo remote-query , i valori HIGH2KEY e LOW2KEY rappresentano i valori più alti e più bassi nella tabella.

Db2 Big SQL

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. Con entrambi i tipi, i valori HIGH2KEY e LOW2KEY rappresentano i valori più alti e più bassi nella tabella.

Db2 for z/OS

Per raccogliere le statistiche della tabella locale, utilizzare il comando RUNSTATS . Non vengono raccolte statistiche per i tipi LOB. La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. Con questo metodo, i valori HIGH2KEY e LOW2KEY (che rappresentano i secondi valori più alti e più bassi nella tabella) vengono copiati dal catalogo Db2 . Con il remote-query tipo raccolta, i valori HIGH2KEY e LOW2KEY rappresentano i valori più alti e più bassi nella tabella.

Db2 for z/OS® non supporta la statistica NUMNULLS. Se le query possono trarre vantaggio da questa statistica, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Greenplum

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto Greenplum . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Greenplum non supporta la statistica HIGH2KEY o LOW2KEY . Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Hive

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto Hive . Il tipo di raccolta delle statistiche remote-catalog in Hive non è consigliato a causa di problemi noti con la raccolta delle statistiche in Hive. Utilizzare invece il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Informix

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione UPDATE STATISTICS , come descritto nella documentazione di Informix® . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Informix non supporta la statistica HIGH2KEY, LOW2KEYo NUMNULLS. Raccoglie solo CARD (cardinalità tabella) e COLCARD (cardinalità colonna). Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query .. Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

MariaDB

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto MariaDB . Le statistiche per le colonne di tipo TEXT o di tipo BLOB non vengono raccolte. La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. È necessario disporre dei privilegi amministrativi per accedere alle statistiche del catalogo, che è richiesto quando si utilizza il tipo di raccolta delle statistiche remote-catalog .

MariaDB non supporta la statistica COLCARD. Se le query possono trarre vantaggio da questa statistica, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Microsoft SQL Server

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione UPDATE STATISTICS , come descritto nella documentazione di Microsoft SQL Server . Le statistiche per le colonne di tipo XML non vengono raccolte. La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Microsoft SQL Server raccoglie solo CARD (cardinalità tabella) e COLCARD (cardinalità colonna). Non supporta le statistiche HIGH2KEY, LOW2KEYo NUMNULLS. Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

MySQL

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione ANALYZE TABLE , come descritto nella documentazione di MySQL . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

MySQL raccoglie solo CARD (cardinalità tabella) e COLCARD (cardinalità colonna). Non supporta le statistiche HIGH2KEY, LOW2KEYo NUMNULLS. Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Netezza Performance Server

Per raccogliere le statistiche della tabella locale, utilizzare il comando GENERATE STATISTICS , come descritto nella documentazione del prodotto Netezza® . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. Con entrambi i tipi, i valori HIGH2KEY e LOW2KEY rappresentano i valori più alti e più bassi nella tabella.

Oracle

Per raccogliere le statistiche della tabella locale, utilizzare il comando ANALYZE , come descritto nella documentazione del prodotto Oracle . In alternativa, è possibile raccogliere statistiche utilizzando DBMS_STATS.GATHER_TABLE_STATS . È anche possibile configurare una raccolta automatica di statistiche nell'origine dati remota Oracle . Non vengono raccolte statistiche per i tipi LOB. La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche. Con entrambi i tipi, i valori HIGH2KEY e LOW2KEY rappresentano i valori più alti e più bassi nella tabella.

SAP ASE

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione UPDATE STATISTICS , come descritto nella documentazione di SAP ASE . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

SAP ASE raccoglie solo CARD (cardinalità tabella). Non supporta le statistiche COLCARD, HIGH2KEY, LOW2KEYo NUMNULLS. Utilizzare il tipo di raccolta delle statistiche remote-query per le colonne chiave utilizzate nei predicati. Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

SAP HANA

Per raccogliere le statistiche della tabella locale, utilizzare l'istruzione CREATE STATISTICS ON , come descritto nella documentazione di SAP HANA . La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

SAP HANA raccoglie solo CARD (cardinalità tabella) e COLCARD (cardinalità colonna). Non supporta le statistiche HIGH2KEY, LOW2KEYo NUMNULLS. Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Snowflake

Snowflake non supporta un metodo esplicito per la raccolta delle statistiche. Tuttavia, la colonna ROW_COUNT della tabella di catalogo INFORMATION_SCHEMA.TABLES memorizza il valore della cardinalità della tabella (CARD) come parte della raccolta delle statistiche Data Virtualization. La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Snowflake raccoglie solo CARD (cardinalità tabella). Non supporta le statistiche COLCARD, HIGH2KEY, LOW2KEYo NUMNULLS. Utilizzare il tipo di raccolta delle statistiche remote-query per le colonne chiave utilizzate nei predicati. Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Teradata

Per raccogliere le statistiche della tabella locale, utilizzare il comando COLLECT STATISTICS , come descritto nella documentazione del prodotto Teradata . Specificare l'opzione THRESHOLD per evitare la raccolta di statistiche ridondanti. Con questa opzione, se la quantità di dati che sono stati modificati dall'ultima raccolta di statistiche è inferiore a una soglia specificata o se le statistiche sono più recenti di una durata specificata, Teradata non raccoglie nuovamente le statistiche. Le statistiche non vengono raccolte per il tipo PERIOD (ad eccezione delle espressioni BEGIN e END), il tipo XML, BLOB o CLOB o qualsiasi tipo definito dall'utente (diverso da un tipo geospaziale). La procedura ottimale consiste nel garantire che le statistiche vengano raccolte nell'origine dati remota e nell'utilizzare il remote-catalog tipo di raccolta delle statistiche.

Teradata non supporta la statistica HIGH2KEY o LOW2KEY . Se le query traggono vantaggio da queste statistiche, utilizzare il tipo di raccolta delle statistiche remote-query . Questo tipo può richiedere molte risorse e molto tempo per essere completato se la tabella virtualizzata ha molte righe o se le statistiche sono raccolte per molte colonne. Si consiglia di raccogliere le statistiche quando il sistema è meno occupato. Evitare di pianificare molti lavori di raccolta statistiche contemporaneamente.

Origini dati IBM Cloud Object Storage, Amazon S3, Ceph, o Generic S3

Per raccogliere le statistiche sulle tabelle virtualizzate nelle origini dati IBM Cloud Object Storage, Amazon S3, Ceph, o Generic S3 , utilizzare il comando ANALYZE .

Se la tabella ha una grande quantità di dati, specificare l'opzione TABLESAMPLE per raccogliere statistiche su un sottoinsieme di dati in modo che l'operazione di analisi possa essere completata prima.

Consultare anche Raccolta di statistiche per i dati nell'archivio oggetti.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni