0 / 0
Go back to the English version of the documentation
Gromadzenie statystyk w programie Watson Query
Last updated: 31 mar 2023
Gromadzenie statystyk w programie Watson Query

Aby zoptymalizować wydajność zapytań, można gromadzić statystyki dotyczące danych, które są odpytywane.

Decyzje podejmowane przez optymalizator na podstawie kosztów mają kluczowe znaczenie dla wydajności zapytań. Optymalizator podejmuje decyzje, korzystając z informacji statystycznych dotyczących danych, które są odpytywane. Dokładne i aktualne statystyki zapewniają optymalną wydajność zapytań. Zbieraj statystyki, jeśli mają zastosowanie następujące warunki.

  • Nowa tabela zostanie utworzona i zapełniona danymi.
  • Dane istniejącej tabeli są istotne ze względu na istotne zmiany, takie jak następujące warunki:
    • Dodano nowe dane.
    • Stare dane są usuwane.
    • Istniejące dane zostaną zaktualizowane.

Watson Query gromadzi statystyki dla następujących elementów, aby optymalizator miał wystarczającą ilość informacji do budowania wydajnych planów wykonania:

  • Dowolna tabela, do której istnieje odwołanie w zapytaniu.
  • Wszystkie kolumny, do których istnieją odwołania w predykatach (w tym predykaty łączenia) i funkcje agregacyjne, do których istnieją odwołania w zapytaniach.

Nie ma potrzeby gromadzenia statystyk dla kolumn, które pojawiają się tylko na pierwszej liście SELECT zapytania.

Ważne: Zbieranie statystyk ma kluczowe znaczenie dla wydajności zapytań, dlatego ważne jest, aby mieć aktualne statystyki. Gromadzenie statystyk może być wymagalne i czasochłonne, jeśli tabela zwirtualizowana zawiera wiele wierszy lub statystyk jest zbieranych dla wielu kolumn. Rozważ zbieranie statystyk, gdy system jest mniej zajęty. Unikaj planowania wielu zadań gromadzenia statystyk w tym samym przedziale czasu.
W programie Watson Querygromadzone są następujące podstawowe statystyki:
Liczność tabeli (CARD)
Liczba wierszy w tabeli.
Liczność kolumny (COLCARD)
Liczba odrębnych wartości w kolumnie.
Klucz wysoki (HIGH2KEY)
Najwyższa lub druga najwyższa wartość danych dla kolumny, w zależności od zdalnego źródła danych dla zwirtualizowanej tabeli i typu kolekcji, która jest używana.
Niski klucz (LOW2KEY)
Najniższa lub druga najniższa wartość danych dla kolumny, w zależności od zdalnego źródła danych dla zwirtualizowanej tabeli i typu kolekcji, która jest używana.
Liczba wartości null (NUMNULLS)
Liczba wartości null w kolumnie. Ta liczba jest jedyną statystyką, która jest kolekcjonowana dla kolumn typu LOB.

Typy kolekcji statystyk

Program Watson Query obsługuje dwa typy gromadzenia danych statystycznych:
remote-catalog
Ten typ gromadzenia danych statystycznych jest obsługiwany tylko w przypadku tabel zwirtualizowanych w zdalnych źródłach danych, które obsługują lokalną metodę gromadzenia statystyk. Dane statystyczne zapisane w tabelach katalogu w zdalnym źródle danych są pobierane, a następnie zapisywane w katalogu statystyk Watson Query . Kluczowe znaczenie ma zapewnienie, że dokładne statystyki są dostępne w zdalnym źródle danych. Typ gromadzenia statystyk remote-catalog nie jest obsługiwany w przypadku tabel pogrupowanych.
remote-query
Ten typ gromadzenia statystyk używa zapytań SQL dla zwirtualizowanej tabeli w celu obliczenia statystyk. Ten typ może być wymagający użycia zasobów i może zająć dużo czasu, jeśli zwirtualizowana tabela zawiera wiele wierszy lub statystyk jest zbieranych dla wielu kolumn.

Sprawdzone procedury

W przypadku zdalnych źródeł danych, które obsługują lokalne narzędzia gromadzenia danych statystycznych, takie jak IBM® Db2® i Oracle, Sprawdzoną procedurą gromadzenia danych statystycznych w programie Watson Query jest sprawdzenie, czy statystyki lokalne w zdalnym źródle danych są dokładne i aktualne, a w szczególności podstawowe statystyki kolumn dla kolumn kluczowych używanych w predykatach zapytań. Dobrym pomysłem jest utworzenie zadania zbierania statystyk w kliencie WWW Watson Query w tym celu.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more