0 / 0
Go back to the English version of the documentation
Wysoka dostępność i odtwarzanie po awarii w programie Watson Query
Last updated: 24 kwi 2023
Wysoka dostępność i odtwarzanie po awarii w programie Watson Query

Plany Watson Query mają doskonałą charakterystykę dostępności z umową SLA o wartości 99.99%.

Mechanizm HADR (High Availability Disaster Recovery) w programie Watson Query Enterprise jest udostępniany za pomocą replikacji HADR. Oprócz funkcji HADR dla dalszej nadmiarowości, kopie zapasowe usługi są replikowane między regionami domyślnie i są pobierane co 24 godziny i zapisywane przez co najmniej 14 dni.

  • Każdy system HADR składa się z trzech węzłów, które znajdują się w różnych niezależnych strefach dostępności w obrębie tego samego regionu.
  • Watson Query obsługuje regiony Dallas, Frankfurt, Londyn i Tokio.
Schematyczny widok na 3 węzły w różnych strefach dostępności
  • Węzeł podstawowy przetwarza transakcje odczytu i zapisu. Jeden z węzłów rezerwowych jest replikowany synchronicznie, co oznacza, że każda transakcja jest zatwierdzana na co najmniej dwóch węzłach, zanim zakończy się pomyślnie, i udostępnia cel punktu odtwarzania równy 0. Ten węzeł rezerwowy jest gotowy do przetwarzania zapisu w przypadku wystąpienia awarii lub wystąpienia zdarzenia konserwacji. Inny węzeł rezerwowy jest asynchronicznie replikowany i przyjmuje rolę węzła synchronicznego w przypadku awarii lub zdarzenia konserwacji. Nawet jeśli użytkownik doświadczy całego błędu w centrum przetwarzania danych lub zdarzenia konserwacji, nadal istnieje system wysokiej dostępności, który jest replikowany między innymi, zachowującymi się centrami przetwarzania danych.
Schematyczny widok przełączania awaryjnego węzła podstawowego
  • Podczas zdarzeń przełączania awaryjnego można oczekiwać od 10 do 20 sekund, w czasie których transakcje są ograniczone. Klient może bezproblemowo przełączać się awaryjnie przy użyciu automatycznego przekierowywania klientów (ACR) wraz z odpowiednią logiką ponawiania dla wszystkich transakcji zakończonych niepowodzeniem. Może potrwać do 5 minut dla wszystkich połączeń, które mają być pomyślnie ponownie nawiązane i przetwarzane.

  • Przełączenie awaryjne jest zarządzane przez program IBM®. IBM monitoruje poprawność serwera, przełącza się awaryjnie i w razie potrzeby nie powiedzie się, w tym aktualizacje i skalowanie zmian, aby utrzymać czas dostępności w możliwie największym zakresie.

  • Kopie zapasowe są używane tylko do odtwarzania przez usługę, jeśli kompletna utrata instancji regionalnej lub instancji usługi jest wykonywana bez możliwości odtwarzania. W razie potrzeby kopie zapasowe są zarządzane i odtwarzane przez personel IBM . Jeśli użytkownik doświadczy całkowitej utraty instancji usługi, może zostać poproszony o udostępnienie nowej instancji usługi przed odtworzeniem danych.