0 / 0
Volver a la versión inglesa de la documentación
Limitaciones de la recogida de estadísticas en la Data Virtualization
Última actualización: 26 nov 2024
Limitaciones específicas de la fuente de datos para recopilar estadísticas en Data Virtualization

Los orígenes de datos difieren en su soporte de la recopilación de estadísticas locales y admiten diferentes estadísticas de columna. También dan soporte a diferentes métodos de recopilación de estadísticas.

Data Virtualization admite dos tipos de recopilación de estadísticas.
remote-catalog
Este tipo de recopilación de estadísticas solo está soportado para las tablas virtualizadas en los orígenes de datos remotos que dan soporte a un método local de recopilación de estadísticas. Las estadísticas almacenadas en las tablas del catálogo de la fuente de datos remota se recuperan y se almacenan en el catálogo de estadísticas Data Virtualization.Es fundamental asegurarse de que las estadísticas precisas estén disponibles en el origen de datos remoto. El tipo remote-catalog de recopilación de estadísticas no está soportado para las tablas agrupadas.

La tabla siguiente identifica los orígenes de datos que dan soporte a la recopilación de estadísticas locales y muestra qué estadísticas de columna están disponibles.

Origen de datos Estadísticas básicas disponibles Con soporte
remote-catalog
Con soporte
remote-query
Amazon Redshift CARD, COLCARD, NUMNULLS
Amazon S3 Consulte Recopilación de estadísticas para datos en el almacenamiento de objetos. Nee
Ceph® Consulte Recopilación de estadísticas para datos en el almacenamiento de objetos. Nee
Cloudera Impala CARD, COLCARD, NUMNULLS. Las versiones recientes de Impala (1.4 y posteriores) no recopilan NUMNULLS.
Databases for PostgreSQL CARD, COLCARD, NUMNULLS
Db2® CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 Big SQL CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Db2 for z/OS CARD, COLCARD, HIGH2KEY, LOW2KEY
Db2 on Cloud CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
S3 genérico Consulte Recopilación de estadísticas para datos en el almacenamiento de objetos. Nee
Greenplum CARD, COLCARD, NUMNULLS
Hive CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
(No recomendado)
IBM® Cloud Object Storage Consulte Recopilación de estadísticas para datos en el almacenamiento de objetos. Nee
Informix CARD, COLCARD
MariaDB CARD, HIGH2KEY, LOW2KEY, NUMNULLS
Microsoft SQL Server CARD, COLCARD
MySQL CARD, COLCARD
Netezza Performance Server CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
Oracle CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS
SAP ASE TARJETA
SAP HANA CARD, COLCARD
Snowflake TARJETA
Teradata CARD, COLCARD, NUMNULLS

Amazon Redshift

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto Amazon Redshift . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Amazon Redshift no da soporte a las estadísticas HIGH2KEY y LOW2KEY. Además, el mandato ANALYZE no recopila estadísticas para los datos de columna CHAR y NCHAR si la longitud de los datos de columna supera los 1020 bytes. Si una columna contiene solo valores NULL, no se recopilan estadísticas de columna.

Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas de remote-query. Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Cloudera Impala

Para recopilar estadísticas de tabla local, utilice la sentencia COMPUTE STATS , tal como se describe en la documentación del producto Cloudera Impala . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Cloudera Impala no da soporte a las estadísticas HIGH2KEY o LOW2KEY y las versiones más recientes de Impala no dan soporte a las estadísticas NUMNULLS. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Bases de datos para PostgreSQL

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto PostgreSQL . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

PostgreSQL no da soporte a las estadísticas HIGH2KEY y LOW2KEY. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Db2 y Db2 on Cloud

Para recopilar estadísticas de tabla local para estos orígenes de datos, utilice el mandato RUNSTATS . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog. Con este tipo, los valores HIGH2KEY y LOW2KEY (que representan el segundo valor más alto y el segundo más bajo de la tabla) se copian del catálogo de Db2 . Con el tipo remote-query , los valores HIGH2KEY y LOW2KEY representan los valores más altos y más bajos de la tabla.

Db2 Big SQL

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog. Con ambos tipos, los valores HIGH2KEY y LOW2KEY representan los valores más altos y más bajos de la tabla.

Db2 for z/OS

Para recopilar estadísticas de tabla local, utilice el mandato RUNSTATS . Las estadísticas no se recopilan para los tipos LOB. La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog. Con este método, los valores HIGH2KEY y LOW2KEY (que representan los segundos valores más altos y segundos más bajos de la tabla) se copian del catálogo de Db2 . Con el tipo de colección remote-query , los valores HIGH2KEY y LOW2KEY representan los valores más altos y más bajos de la tabla.

Db2 for z/OS® no da soporte a la estadística NUMNULLS. Si las consultas se beneficiarían de esta estadística, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Greenplum

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto Greenplum . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Greenplum no da soporte a las estadísticas HIGH2KEY y LOW2KEY. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Hive

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto Hive . El tipo de recopilación de estadísticas de remote-catalog en Hive no se recomienda debido a problemas conocidos con la recopilación de estadísticas en Hive. En su lugar, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Informix

Para recopilar estadísticas de tabla local, utilice la sentencia UPDATE STATISTICS , tal como se describe en la documentación del producto Informix® . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Informix no da soporte a las estadísticas HIGH2KEY, LOW2KEY o NUMNULLS. Sólo recopila CARD (cardinalidad de tabla) y COLCARD (cardinalidad de columna). Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query .. Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

MariaDB

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto MariaDB . Las estadísticas para las columnas tipo TEXT o BLOB no se recopilan. La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog. Debe tener privilegios administrativos para acceder a las estadísticas de catálogo, lo que es necesario cuando se utiliza el tipo de recopilación de estadísticas de remote-catalog .

MariaDB no da soporte a la estadística COLCARD. Si las consultas se beneficiarían de esta estadística, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Microsoft SQL Server

Para recopilar estadísticas de tabla local, utilice la sentencia UPDATE STATISTICS , tal como se describe en la documentación del producto Microsoft SQL Server . No se recopilan las estadísticas para las columnas de tipo XML. La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Microsoft SQL Server solo recopila CARD (cardinalidad de tabla) y COLCARD (cardinalidad de columna). No da soporte a las estadísticas HIGH2KEY, LOW2KEYo NUMNULLS. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

MySQL

Para recopilar estadísticas de tabla local, utilice la sentencia ANALYZE TABLE , tal como se describe en la documentación del producto MySQL . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

MySQL solo recopila CARD (cardinalidad de tabla) y COLCARD (cardinalidad de columna). No da soporte a las estadísticas HIGH2KEY, LOW2KEYo NUMNULLS. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Netezza Performance Server

Para recopilar estadísticas de tabla local, utilice el mandato GENERATE STATISTICS , tal como se describe en la documentación del producto Netezza® . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog. Con ambos tipos, los valores HIGH2KEY y LOW2KEY representan los valores más altos y más bajos de la tabla.

Oracle

Para recopilar estadísticas de tabla local, utilice el mandato ANALYZE , tal como se describe en la documentación del producto Oracle . De forma alternativa, puede recopilar estadísticas utilizando el procedimiento DBMS_STATS.GATHER_TABLE_STATS. También puede configurar la recopilación automática de estadísticas en el origen de datos remoto de Oracle. Las estadísticas no se recopilan para los tipos LOB. Se recomienda asegurarse de que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas remote-catalog . Con ambos tipos, los valores HIGH2KEY y LOW2KEY representan los valores más altos y más bajos de la tabla.

SAP ASE

Para recopilar estadísticas de tabla local, utilice la sentencia UPDATE STATISTICS , tal como se describe en la documentación del producto SAP ASE . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

SAP ASE solo recopila CARD (cardinalidad de tabla). No da soporte a las estadísticas COLCARD, HIGH2KEY, LOW2KEY o NUMNULLS. Utilice el tipo de recopilación de estadísticas de remote-query para las columnas de clave que se utilizan en los predicados. Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

SAP HANA

Para recopilar estadísticas de tabla local, utilice la sentencia CREATE STATISTICS ON , tal como se describe en la documentación del producto SAP HANA . La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

SAP HANA solo recopila CARD (cardinalidad de tabla) y COLCARD (cardinalidad de columna). No da soporte a las estadísticas HIGH2KEY, LOW2KEYo NUMNULLS. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Snowflake

Snowflake no da soporte a un método explícito para recopilar estadísticas. Sin embargo, la columna ROW_COUNT de la tabla de catálogo INFORMATION_SCHEMA.TABLES almacena el valor de cardinalidad de la tabla (CARD) como parte de la recopilación de estadísticas Data Virtualization. La práctica recomendada es garantizar que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas de remote-catalog.

Snowflake solo recopila CARD (cardinalidad de tabla). No da soporte a las estadísticas COLCARD, HIGH2KEY, LOW2KEY o NUMNULLS. Utilice el tipo de recopilación de estadísticas de remote-query para las columnas de clave que se utilizan en los predicados. Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Teradata

Para recopilar estadísticas de tabla local, utilice el mandato COLLECT STATISTICS , tal como se describe en la documentación del producto Teradata . Especifique la opción THRESHOLD para evitar la recopilación de estadísticas redundantes. Con esta opción, si la cantidad de datos que han cambiado desde la última recopilación de estadísticas está bajo un umbral especificado, o si las estadísticas son más recientes que una antigüedad especificada, Teradata no recopila estadísticas. Las estadísticas no se recopilan para el tipo PERIOD (excepto para las expresiones BEGIN y END), el tipo XML, BLOB o CLOB, o cualquier tipo definido por el usuario (que no sea un tipo geoespacial). Se recomienda asegurarse de que las estadísticas se recopilan en el origen de datos remoto y utilizar el tipo de recopilación de estadísticas remote-catalog .

Teradata no da soporte a las estadísticas HIGH2KEY y LOW2KEY. Si las consultas se beneficiarían de estas estadísticas, utilice el tipo de recopilación de estadísticas remote-query . Este tipo puede utilizar muchos recursos y tardar bastante tiempo en completarse si la tabla virtualizada tiene muchas filas o se recopilan muchas estadísticas para muchas columnas. Considere la posibilidad de recopilar estadísticas cuando el sistema esté menos ocupado. Evite planificar muchos trabajos de recopilación de estadísticas al mismo tiempo.

Orígenes de datos IBM Cloud Object Storage, Amazon S3, Ceph, o genéricos S3

Para recopilar estadísticas sobre tablas virtualizadas en orígenes de datos IBM Cloud Object Storage, Amazon S3, Ceph, o genéricos S3 , utilice el mandato ANALYZE .

Si la tabla tiene una gran cantidad de datos, especifique la opción TABLESAMPLE para recopilar estadísticas en un subconjunto de los datos, para que la operación de análisis pueda completarse antes.

Consulte también Recopilación de estadísticas para datos en el almacenamiento de objetos.

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información