0 / 0

Data Virtualization 통계 수집

마지막 업데이트 날짜: 2025년 3월 17일
Data Virtualization 통계 수집

쿼리 성능을 최적화하기 위해 쿼리 중인 데이터에 대한 통계를 수집할 수 있습니다.

비용 기반 최적화 프로그램의 결정은 성능을 쿼리하는 데 중요합니다. 옵티마이저는 쿼리 중인 데이터에 대한 통계 정보를 사용하여 결정을 수행합니다. 정확하고 최신 통계는 최적의 쿼리 성능을 보장합니다. 다음 조건이 적용될 때마다 통계를 수집하십시오.

최적화 프로파일 및 가이드라인에서 최적화 프로그램 및 쿼리 성능에 대해 자세히 읽을 수 있습니다.

  • 새 테이블이 작성되고 데이터로 채워집니다.
  • 기존 테이블의 데이터는 다음 조건과 같은 중요한 변경을 수행합니다.
    • 새 데이터가 추가됩니다.
    • 이전 데이터가 제거됩니다.
    • 기존 데이터가 업데이트됩니다.

Data Virtualization 다음 항목에 대한 통계를 수집하여 옵티마이저가 효율적인 실행 계획을 수립할 수 있는 충분한 정보를 제공합니다:

  • 쿼리에서 참조되는 모든 테이블.
  • 뷰에서 참조되는 모든 테이블입니다. 가상 뷰를 작성할 때 뷰에서 참조되는 모든 테이블에 대한 통계를 수집해야 합니다. 통계는 뷰에서 수집되지 않습니다.
  • 술어 (조인 술어 포함) 및 쿼리에서 참조되는 집계 함수에서 참조되는 모든 컬럼.

쿼리의 첫 번째 선택 목록에만 나타나는 컬럼에 대한 통계를 수집할 필요가 없습니다.

중요: 통계 수집은 좋은 쿼리 성능을 위해 중요하므로 최신 통계를 보유하는 것이 중요합니다. 가상화된 테이블에 많은 열에 대해 행 또는 통계가 수집되는 경우 통계 콜렉션은 자원 집약적이고 완료하는 데 시간이 오래 걸릴 수 있습니다. 시스템 사용량이 적은 경우 통계 수집을 고려하십시오. 동시에 많은 통계 콜렉션 작업을 스케줄하지 마십시오.
Data Virtualization 다음과 같은 기본 통계가 수집됩니다:
테이블 카디널리티(CARD)
테이블의 행 수.
열 카디널리티(COLCARD)
컬럼에 있는 구별 값 수입니다.
높은 키(HIGH2KEY)
가상화된 테이블의 원격 데이터 소스 및 사용되는 콜렉션 유형에 따라 컬럼의 최고 또는 두 번째로 높은 데이터 값입니다.
낮은 키(LOW2KEY)
가상화된 테이블의 원격 데이터 소스 및 사용되는 콜렉션 유형에 따라 컬럼의 최저 또는 두 번째로 낮은 데이터 값입니다. 많은 데이터 소스에서 Data Virtualization 공백 값일 수 있는 가장 낮은 키 값을 수집합니다. 공백은 통계가 수집되지 않았음을 표시하지 않습니다.
널값 수(NUMNULLS)
열에 있는 널값의 수입니다. 이 숫자는 LOB 유형 열에 대해 수집되는 유일한 통계입니다.

통계 콜렉션 유형

Data Virtualization 두 가지 통계 수집 유형을 지원합니다:
remote-catalog
이 유형의 통계 콜렉션은 통계 콜렉션의 로컬 메소드를 지원하는 원격 데이터 소스의 가상화된 테이블에 대해서만 지원됩니다. 원격 데이터 원본의 카탈로그 테이블에 저장된 통계는 검색된 후 Data Virtualization 통계 카탈로그에 저장됩니다.원격 데이터 소스에서 정확한 통계를 사용할 수 있는지 확인하는 것이 중요합니다. 통계 콜렉션의 remote-catalog 유형은 그룹화된 테이블에는 지원되지 않습니다.
remote-query
이 유형의 통계 콜렉션은 통계를 계산하기 위해 가상화된 테이블에 대해 SQL 쿼리를 사용합니다.이 유형은 자원 집약적일 수 있으며, 가상화된 테이블에 행이 너무 많거나 여러 컬럼에 대한 통계를 수집하는 경우 완료하는 데 시간이 오래 걸릴 수 있습니다. 성능을 개선하고 리소스를 절약하려면 Data Virtualization COLLECT_STATISTICS 저장 프로시저에 TABLESAMPLE 옵션을 지정하여 데이터 샘플링을 통해 통계를 수집하거나 클라우드 개체 스토리지의 데이터 소스에 대해 ' ANALYZE ' 명령을 사용할 수 있습니다.

우수 사례

' IBM Db2 ' 및 ' Oracle'와 같은 로컬 통계 수집 도구를 지원하는 원격 데이터 원본의 경우, Data Virtualization 통계 수집 모범 사례는 원격 데이터 원본의 로컬 통계, 특히 쿼리 술어에 사용되는 주요 열에 대한 기본 열 통계가 정확하고 최신 상태인지 확인하는 것입니다. 이를 위해 Data Virtualization 웹 클라이언트에서 통계 수집 작업을 만드는 것이 좋습니다.