Translation not up to date
Aby zoptymalizować wydajność zapytań, można gromadzić statystyki dotyczące danych, które są odpytywane.
Decyzje podejmowane przez optymalizator na podstawie kosztów mają kluczowe znaczenie dla wydajności zapytań. Optymalizator podejmuje decyzje, korzystając z informacji statystycznych dotyczących danych, które są odpytywane. Dokładne i aktualne statystyki zapewniają optymalną wydajność zapytań. Zbieraj statystyki, jeśli mają zastosowanie następujące warunki.
- Nowa tabela zostanie utworzona i zapełniona danymi.
- Dane istniejącej tabeli są istotne ze względu na istotne zmiany, takie jak następujące warunki:
- Dodano nowe dane.
- Stare dane są usuwane.
- Istniejące dane zostaną zaktualizowane.
Watson Query gromadzi statystyki dla następujących elementów, aby optymalizator miał wystarczającą ilość informacji do budowania wydajnych planów wykonania:
- Dowolna tabela, do której istnieje odwołanie w zapytaniu.
- Wszystkie kolumny, do których istnieją odwołania w predykatach (w tym predykaty łączenia) i funkcje agregacyjne, do których istnieją odwołania w zapytaniach.
Nie ma potrzeby gromadzenia statystyk dla kolumn, które pojawiają się tylko na pierwszej liście SELECT zapytania.
- Liczność tabeli (CARD)
- Liczba wierszy w tabeli.
- Liczność kolumny (COLCARD)
- Liczba odrębnych wartości w kolumnie.
- Klucz wysoki (HIGH2KEY)
- Najwyższa lub druga najwyższa wartość danych dla kolumny, w zależności od zdalnego źródła danych dla zwirtualizowanej tabeli i typu kolekcji, która jest używana.
- Niski klucz (LOW2KEY)
- Najniższa lub druga najniższa wartość danych dla kolumny, w zależności od zdalnego źródła danych dla zwirtualizowanej tabeli i typu kolekcji, która jest używana.
- Liczba wartości null (NUMNULLS)
- Liczba wartości null w kolumnie. Ta liczba jest jedyną statystyką, która jest kolekcjonowana dla kolumn typu LOB.
Typy kolekcji statystyk
- remote-catalog
- Ten typ gromadzenia danych statystycznych jest obsługiwany tylko w przypadku tabel zwirtualizowanych w zdalnych źródłach danych, które obsługują lokalną metodę gromadzenia statystyk. Dane statystyczne zapisane w tabelach katalogu w zdalnym źródle danych są pobierane, a następnie zapisywane w katalogu statystyk Watson Query . Kluczowe znaczenie ma zapewnienie, że dokładne statystyki są dostępne w zdalnym źródle danych. Typ gromadzenia statystyk remote-catalog nie jest obsługiwany w przypadku tabel pogrupowanych.
- remote-query
- Ten typ gromadzenia statystyk używa zapytań SQL dla zwirtualizowanej tabeli w celu obliczenia statystyk. Ten typ może być wymagający użycia zasobów i może zająć dużo czasu, jeśli zwirtualizowana tabela zawiera wiele wierszy lub statystyk jest zbieranych dla wielu kolumn.
Sprawdzone procedury
W przypadku zdalnych źródeł danych, które obsługują lokalne narzędzia gromadzenia danych statystycznych, takie jak IBM® Db2® i Oracle, Sprawdzoną procedurą gromadzenia danych statystycznych w programie Watson Query jest sprawdzenie, czy statystyki lokalne w zdalnym źródle danych są dokładne i aktualne, a w szczególności podstawowe statystyki kolumn dla kolumn kluczowych używanych w predykatach zapytań. Dobrym pomysłem jest utworzenie zadania zbierania statystyk w kliencie WWW Watson Query w tym celu.