データ・ソースは、ローカル統計収集のサポートが異なり、さまざまな列統計をサポートします。 また、統計を収集するためのさまざまな方法もサポートしています。
- remote-catalog
- このタイプの統計収集は、ローカル方式の統計収集がサポートされる、リモート・データ・ソース内の仮想化テーブルでのみサポートされます。リモート・データ・ソースのカタログ・テーブルに格納されている統計が取得され、Data Virtualization統計カタログに格納されます。リモート・データ・ソースで正確な統計を使用できるようにすることが重要です。 remote-catalog タイプの統計収集は、グループ化されたテーブルではサポートされません。
以下の表は、ローカル統計収集をサポートするデータ・ソースを示し、使用可能な列統計を示しています。
データ・ソース | 基本統計が使用可能 | サポート remote-catalog
|
サポート remote-query
|
---|---|---|---|
Amazon Redshift | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
Amazon S3 | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
Ceph® | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
Cloudera Impala | CARD, COLCARD, NUMNULLS. 最新バージョンの Impala (1.4 以降) では、NUMNULLS は収集されません。 | ✓ | ✓ |
Databases for PostgreSQL | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
Db2® | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 Big SQL | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Db2 for z/OS | CARD, COLCARD, HIGH2KEY, LOW2KEY | ✓ | ✓ |
Db2 on Cloud | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
汎用 S3 | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
Greenplum | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
Hive | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ (推奨されません)
|
✓ |
IBM® Cloud Object Storage | オブジェクト・ストレージ内のデータの統計の収集を参照してください。 | いいえ | ✓ |
Informix | CARD, COLCARD | ✓ | ✓ |
MariaDB | CARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Microsoft SQL Server | CARD, COLCARD | ✓ | ✓ |
MySQL | CARD, COLCARD | ✓ | ✓ |
Netezza Performance Server | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
Oracle | CARD, COLCARD, HIGH2KEY, LOW2KEY, NUMNULLS | ✓ | ✓ |
SAP ASE | CARD | ✓ | ✓ |
SAP HANA | CARD, COLCARD | ✓ | ✓ |
Snowflake | CARD | ✓ | ✓ |
Teradata | CARD, COLCARD, NUMNULLS | ✓ | ✓ |
Amazon Redshift
ローカル表の統計を収集するには、 Amazon Redshift 製品資料の説明に従って ANALYZE コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Amazon Redshiftでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 また、列データの長さが 1020 バイトを超える場合、 ANALYZE コマンドは CHAR および NCHAR 列データの統計を収集しません。 列に NULL 値のみが含まれている場合、列統計は収集されません。
照会でこれらの統計の利点が得られる場合は、remote-query統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Cloudera Impala
ローカル表の統計を収集するには、 Cloudera Impala 製品資料の説明に従って COMPUTE STATS ステートメントを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Cloudera Impala は HIGH2KEY または LOW2KEY 統計をサポートしておらず、より新しいバージョンの Impala は NUMNULLS 統計をサポートしていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
PostgreSQL 用データベース
ローカル表の統計を収集するには、 PostgreSQL 製品資料の説明に従って ANALYZE コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
PostgreSQLでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Db2 および Db2 on Cloud
これらのデータ・ソースのローカル表統計を収集するには、 RUNSTATS コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。 このタイプでは、 HIGH2KEY 値と LOW2KEY 値 (表の 2 番目に高い値と 2 番目に低い値を表す) が Db2 カタログからコピーされます。 remote-query タイプの場合、 HIGH2KEY 値と LOW2KEY 値は、テーブル内の最大値と最小値を表します。
Db2 Big SQL
ローカル表の統計を収集するには、 ANALYZE コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。 どちらのタイプの場合も、 HIGH2KEY および LOW2KEY の値は、表の中の最高値と最低値を表します。
Db2 for z/OS
ローカル表の統計を収集するには、 RUNSTATS コマンドを使用します。 LOB タイプの統計は収集されません。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。 この方法では、 HIGH2KEY 値と LOW2KEY 値 (表の 2 番目に高い値と 2 番目に低い値を表す) が Db2 カタログからコピーされます。 remote-query コレクション・タイプの場合、 HIGH2KEY 値と LOW2KEY 値は、表内の最高値と最低値を表します。
Db2 for z/OS®は NUMNULLS 統計をサポートしません。 照会がこの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Greenplum
ローカル表の統計を収集するには、 Greenplum 製品資料の説明に従って ANALYZE コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Greenplumでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Hive
ローカル表の統計を収集するには、 Hive 製品資料の説明に従って ANALYZE コマンドを使用します。 Hiveの統計収集に関する既知の問題のため、Hiveのremote-catalog統計収集タイプは推奨されません。 代わりに、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Informix
ローカル表の統計を収集するには、 Informix® 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Informixは、HIGH2KEY、LOW2KEY、または NUMNULLS 統計をサポートしません。 収集するのは CARD (表カーディナリティー) と COLCARD (列カーディナリティー) のみです。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
MariaDB
ローカル表の統計を収集するには、 MariaDB 製品資料の説明に従って ANALYZE コマンドを使用します。 TEXT タイプまたは BLOB タイプの列の統計は収集されません。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。 カタログ統計にアクセスするには、管理特権が必要です。これは、 remote-catalog 統計収集タイプを使用する場合に必要です。
MariaDBは COLCARD 統計をサポートしていません。 照会がこの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Microsoft SQL Server
ローカル表の統計を収集するには、 Microsoft SQL Server 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。 XML タイプ列の統計は収集されません。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Microsoft SQL Serverは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
MySQL
ローカル表の統計を収集するには、 MySQL 製品資料の説明に従って ANALYZE TABLE ステートメントを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
MySQLは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Netezza Performance Server
ローカル表の統計を収集するには、 Netezza® 製品資料の説明に従って GENERATE STATISTICS コマンドを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。 どちらのタイプの場合も、 HIGH2KEY および LOW2KEY の値は、表の中の最高値と最低値を表します。
Oracle
ローカル表の統計を収集するには、 Oracle 製品資料の説明に従って ANALYZE コマンドを使用します。 あるいは、DBMS_STATS.GATHER_TABLE_STATS プロシージャーを使用して統計を収集することもできます。 Oracleリモート・データ・ソースで自動統計収集を構成することもできます。 LOB タイプの統計は収集されません。 ベスト・プラクティスは、リモート・データ・ソースで統計が収集されていることを確認し、 remote-catalog 統計収集タイプを使用することです。 どちらのタイプの場合も、 HIGH2KEY および LOW2KEY の値は、表の中の最高値と最低値を表します。
SAP ASE
ローカル表の統計を収集するには、 SAP ASE 製品資料の説明に従って UPDATE STATISTICS ステートメントを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
SAP ASEは、CARD (表のカーディナリティー) のみを収集します。 COLCARD、HIGH2KEY、LOW2KEY、および NUMNULLS 統計はサポートされません。 述部で使用されるキー列には、 remote-query 統計収集タイプを使用します。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
SAP HANA
ローカル表の統計を収集するには、 SAP HANA 製品資料の説明に従って CREATE STATISTICS ON ステートメントを使用します。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
SAP HANAは、CARD (表カーディナリティー) および COLCARD (列カーディナリティー) のみを収集します。 HIGH2KEY、 LOW2KEY、または NUMNULLS 統計はサポートされません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Snowflake
Snowflakeは、統計を収集するための明示的な方法をサポートしていません。 ただし、INFORMATION_SCHEMA.TABLESカタログ・テーブルのROW_COUNT列には、Data Virtualization統計収集の一環としてテーブルのカーディナリティ(CARD)値が格納されます。 ベスト・プラクティスは、統計がリモート・データ・ソースで収集されるようにし、remote-catalog統計収集タイプを使用することです。
Snowflakeは、CARD (表のカーディナリティー) のみを収集します。 COLCARD、HIGH2KEY、LOW2KEY、および NUMNULLS 統計はサポートされません。 述部で使用されるキー列には、 remote-query 統計収集タイプを使用します。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
Teradata
ローカル表の統計を収集するには、 Teradata 製品資料の説明に従って COLLECT STATISTICS コマンドを使用します。 冗長な統計収集を回避するには、THRESHOLD オプションを指定します。 このオプションを使用すると、最後の統計収集以降に変更されたデータ量が指定されたしきい値を下回っている場合、または統計が指定された経過時間より新しい場合、Teradataは統計を再収集しません。 PERIOD タイプ (BEGIN 式と END 式を除く)、XML タイプ、BLOB タイプ、CLOB タイプ、またはユーザー定義タイプ (地理空間タイプ以外) については、統計は収集されません。 ベスト・プラクティスは、リモート・データ・ソースで統計が収集されていることを確認し、 remote-catalog 統計収集タイプを使用することです。
Teradataでは、HIGH2KEY 統計も LOW2KEY 統計もサポートされていません。 照会がこれらの統計から利益を得る場合は、 remote-query 統計収集タイプを使用してください。 仮想表に多数の行がある場合、または多数の列について統計が収集される場合、このタイプはリソースを大量に消費する可能性があり、完了までに時間がかかることがあります。 システムの負荷が低いときに統計を収集することを検討してください。 多数の統計収集ジョブを同時にスケジュールすることは避けてください。
IBM Cloud Object Storage、 Amazon S3、 Ceph、 または汎用 S3 データ・ソース
IBM Cloud Object Storage、 Amazon S3、 Ceph、 または汎用 S3 データ・ソースの仮想表に関する統計を収集するには、 ANALYZE コマンドを使用します。
表に大量のデータがある場合は、TABLESAMPLEオプションを指定して、データのサブセットに関する統計を収集し、分析操作をより早く完了できるようにします。
オブジェクト・ストレージ内のデータの統計の収集も参照してください。