0 / 0
Go back to the English version of the documentation
Skalowanie wdrożenia
Last updated: 07 lip 2023
Skalowanie wdrożenia

W przypadku tworzenia wdrożenia w trybie z połączeniem dla modelu lub funkcji z obszaru wdrażania lub programowego, pojedyncza kopia zasobu jest wdrażana domyślnie. Aby zwiększyć skalowalność i dostępność, można zwiększyć liczbę kopii (replik), edytując konfigurację wdrożenia. Dodatkowe repliki pozwalają na zwiększenie liczby żądań oceniania.

Wdrożenia można skalować w jeden z następujących sposobów:

  • Zaktualizuj konfigurację dla wdrożenia w obszarze wdrażania.
  • Programowo, korzystając z biblioteki klienta Watson Machine Learning Python lub interfejsu API REST Watson Machine Learning .

Zwiększanie liczby replik wdrożenia w trybie z połączeniem z obszaru

  1. Kliknij tę opcję, aby otworzyć kartę Wdrożenie w obszarze wdrażania.

  2. Kliknij opcję Edytuj konfigurację w menu działań dla nazwy wdrożenia.

  3. Zmień liczbę replik i zapisz zmiany.

    Skalowanie wdrożenia

    Wskazówka: Można również zaktualizować liczbę replik z arkusza informacyjnego dla wdrożenia.

    Aby zaktualizować liczbę replik, wykonaj następujące kroki:

  4. Kliknij nazwę wdrożenia, aby wyświetlić szczegóły.

  5. Kliknij ikonę Edytuj w arkuszu informacyjnym, aby edytować liczbę kopii.
    Aktualizowanie konfiguracji wdrożenia

Programowo zwiększenie liczby replik wdrożeniowe

Aby możliwe było wyświetlanie lub uruchamianie próbnej próby skalowania w sposób programowy, można zwiększyć liczbę replik w metadanych dla wdrożenia.

Przykład Python

W tym przykładzie używany jest klient Python w celu ustawienia liczby replik na 3.

change_meta = {
                client.deployments.ConfigurationMetaNames.HARDWARE_SPEC: {
                                       "name":"S",
                                       "num_nodes":3}
            }

client.deployments.update(<deployment_id>, change_meta)

Wartość HARDWARE_SPEC zawiera nazwę, ponieważ interfejs API wymaga nazwy lub identyfikatora, który ma zostać udostępniony.

Przykład interfejsu REST API

curl -k -X PATCH -d '[ { "op": "replace", "path": "/hardware_spec", "value": {  "name": "S", "num_nodes": 2  } } ]' <Deployment end-point URL>

Należy podać nazwę dla wartości hardware_spec , ale argument nie jest stosowany do skalowania.

Temat nadrzędny: Zarządzanie wdrożeniami predykcyjnymi

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more