0 / 0
Go back to the English version of the documentation
Oblicz opcje zasobów dla edytora notatnika w projektach
Last updated: 09 lis 2023
Oblicz opcje zasobów dla edytora notatnika w projektach

Po uruchomieniu notatnika w edytorze notatnika w projekcie należy wybrać szablon środowiska, który definiuje zasoby obliczeniowe dla środowiska wykonawczego. Szablon środowiska określa typ, wielkość i moc konfiguracji sprzętu oraz konfigurację oprogramowania. W przypadku notebooków szablony środowiska zawierają obsługiwany język Python i R.

Typy środowisk

W celu uruchomienia notatnika można użyć następujących typów środowisk:

Większość typów środowisk dla notebooków ma domyślne szablony środowiska, dzięki czemu można szybko rozpocząć pracę. W przeciwnym razie można utworzyć niestandardowe szablony środowiska.

Typy środowisk dla notatników
Typ środowiska Szablony domyślne Szablony niestandardowe
Procesor Anaconda
Grupy Spark
Procesor graficzny

Wersje środowiska wykonawczego

Domyślne środowiska dla notebooków są dodawane jako część wersji środowiska wykonawczego z przedrostkiem Runtime , po którym następuje rok wydania i wersja wydania.

Wersja środowiska wykonawczego określa listę kluczowych bibliotek analityki danych i wersję językową, na przykład Python 3.10. Wszystkie środowiska w wersji środowiska wykonawczego są budowane na podstawie wersji bibliotek zdefiniowanych w wersji, co zapewnia spójne wykorzystanie bibliotek analityki danych we wszystkich aplikacjach analityki danych.

Wersje Runtime 22.2 i Runtime 23.1 są dostępne dla Python 3.10 i R 4.2.

Chociaż wersja środowiska wykonawczego jest obsługiwana, produkt IBM zaktualizuje wersje bibliotek, aby spełnić wymagania dotyczące bezpieczeństwa. Należy zauważyć, że te aktualizacje nie zmienią wersji <Major>.<Minor> bibliotek, ale tylko wersji <Patch> . Dzięki temu zasoby notatnika będą nadal działać.

Pakiety bibliotek dołączone do środowisk wykonawczych

Konkretne wersje popularnych pakietów bibliotek data science zawartych w środowiskach wykonawczych Watson Studio znajdują się w następujących tabelach:

Tabela 3. Pakiety i ich wersje w różnych wydaniach środowiska wykonawczego Python
taśmowa Środowisko wykonawcze 22.2 w środowisku Python 3.10 Środowisko wykonawcze 23.1 w środowisku Python 3.10
Keras 2.9 2.12
Lale 0.7 0.7
LightGBM 3.3 3.3
NumPy 1.23 1.23
ONNX 1.12 1.13
Środowisko wykonawcze ONNX 1.12 1.13
OpenCV 4.6 4.7
Pand 1.4 1.5
PyArrow 8.0 11.0
PyTorch 1.12 2.0
Scikit-nauka 1.1 1.1
SciPy 1.8 1.10
SnapML 1.8 1.13
TensorFlow 2.9 2.12
XGBoost 1.6 1.6
Tabela 4. Pakiety i ich wersje w różnych wydaniach środowiska wykonawczego dla języka R
taśmowa Środowisko wykonawcze 22.2 na platformie R 4.2 Środowisko wykonawcze 23.1 na platformie R 4.2
Strzałka 8.0 11.0
Samochód 3.0 3.0
Znak karetki 6.0 6.0
katoole 1.18 1.18
prognoza 8.16 8.16
ggplot2 3.3 3.3
glmnet 4.1 4.1
hmisc 4.7 4.7
Keras 2.9 2.12
lme4 1.1 1.1
mvtnorm 1.1 1.1
pandoc 2.12 2.12
psych 2.2 2.2
python 3.10 3.10
losowy las 4.7 4.7
wycofaj 1.25 1.25
Kanapka 3.0 3.0
Scikit-nauka 1.1 1.1
przestrzenne 7.3 7.3
tensorflow 2.9 2.12
tidyr 1.2 1.2
xgboost 1.6 1.6

Oprócz bibliotek wymienionych w tabelach środowiska wykonawcze zawierają wiele innych przydatnych bibliotek. Aby wyświetlić pełną listę, należy wybrać kartę Zarządzanie w projekcie, kliknąć opcję Szablony, wybrać kartę Środowiska , a następnie kliknąć jedno z wymienionych środowisk.

Szablony środowiska procesora

Dla notatników można wybrać dowolny z następujących domyślnych szablonów środowiska procesora. Domyślne szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.

DO Wskazuje, że szablony środowiska zawierają biblioteki CPLEX i DOcplex do modelowania i rozwiązywania problemów z optymalizacją decyzji, które przekraczają złożoność obsługiwaną przez produkt Community Edition bibliotek w innych domyślnych środowiskach Python . Patrz notatnikiDecision Optimization.

NLP Wskazuje, że szablony środowiska zawierają bibliotekę Watson Natural Language Processing z wstępnie wytrenowanymi modelami dla zadań przetwarzania języka, które można uruchomić na danych nieustrukturyzowanych. Patrz Korzystanie z biblioteki Watson Natural Language Processing. To domyślne środowisko powinno być wystarczająco duże, aby można było uruchamiać wstępnie wytrenowane modele.

Domyślne szablony środowiska procesora dla notatników
Nazwa Konfiguracja sprzętowa Stawka CUH na godzinę
Środowisko wykonawcze 22.2 w środowisku Python 3.10 XXS 1 vCPU i 4 GB pamięci RAM 0.5
Środowisko wykonawcze 22.2 w środowisku Python 3.10 XS 2 vCPU i 8 GB pamięci RAM 1
Środowisko wykonawcze 22.2 w środowisku Python 3.10 4 vCPU i 16 GB pamięci RAM 2
Środowisko wykonawcze 23.1 w środowisku Python 3.10 XXS 1 vCPU i 4 GB pamięci RAM 0.5
Środowisko wykonawcze 23.1 w środowisku Python 3.10 XS 2 vCPU i 8 GB pamięci RAM 1
Środowisko wykonawcze 23.1 w środowisku Python 3.10 4 vCPU i 16 GB pamięci RAM 2
DO + NLP Runtime 22.2 na platformie Python 3.10 XS 2 vCPU i 8 GB pamięci RAM 6
Środowisko wykonawcze NLP 23.1 na platformie Python 3.10 XS 2 vCPU i 8 GB pamięci RAM 6
Środowisko wykonawcze 22.2 na platformie R 4.2 4 vCPU i 16 GB pamięci RAM 2
Środowisko wykonawcze 23.1 na platformie R 4.2 4 vCPU i 16 GB pamięci RAM 2

Należy zatrzymać wszystkie aktywne środowiska wykonawcze CPU, gdy nie są już potrzebne, aby zapobiec zużywaniu dodatkowych jednostek mocy obliczeniowej (CUH). Patrz CPU idle timeout (Limit czasu bezczynności procesora).

Notatniki i środowiska procesora

Po otwarciu notatnika w trybie edycji w środowisku wykonawczym procesora, dokładnie jedna sesja interaktywna łączy się z jądrem Jupyter dla wybranego języka notatnika i środowiska wykonawczego. Środowisko wykonawcze jest uruchamiane dla pojedynczego użytkownika, a nie dla notatnika. Oznacza to, że jeśli zostanie otwarty drugi notatnik z tym samym szablonem środowiska w tym samym projekcie, drugie jądro zostanie uruchomione w tym samym środowisku wykonawczym. Zasoby środowiska wykonawczego są współużytkowane przez jądra Jupyter, które są uruchamiane w środowisku wykonawczym. Zasoby środowiska wykonawczego są również współużytkowane, jeśli procesor ma procesor GPU.

Aby uniknąć współużytkowania środowisk wykonawczych, ale używać tego samego szablonu środowiska dla wielu notatników w projekcie, należy utworzyć niestandardowe szablony środowiska z tymi samymi specyfikacjami i powiązać każdy notatnik z jego własnym szablonem.

W razie potrzeby można zrestartować jądro lub ponownie nawiązać z tym jądrem połączenie. Po zrestartowaniu jądra jest ono zatrzymywane, a następnie ponownie uruchamiane w tej samej sesji, ale wszystkie wyniki wykonania są tracone. Po ponownym nawiązaniu połączenia z jądrem po utracie połączenia notatnik jest połączony z tą samą sesją jądra, a wszystkie poprzednio zapisane wyniki wykonania są dostępne.

Szablony środowiska Spark

Dla notatników można wybrać dowolny z następujących domyślnych szablonów środowiska Spark. Domyślne szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.

Domyślne szablony środowiska Spark dla notatników
Nazwa Konfiguracja sprzętowa Stawka CUH na godzinę
Domyślny system Spark 3.3 & R 4.2 2 Wykonawcy każdy: 1 vCPU i 4 GB RAM;
Sterownik: 1 vCPU i 4 GB RAM
1
Domyślny Spark 3.4 & R 4.2 2 Wykonawcy każdy: 1 vCPU i 4 GB RAM;
Sterownik: 1 vCPU i 4 GB RAM
1

Należy zatrzymać wszystkie aktywne środowiska wykonawcze Spark, gdy nie są one już potrzebne, aby zapobiec zużywaniu dodatkowych jednostek mocy obliczeniowej (CUHs). Patrz Limit czasu bezczynności Spark.

Duże środowiska Spark

Jeśli masz plan Watson Studio Professional, możesz utworzyć niestandardowe szablony środowiska dla większych środowisk Spark.

Profesjonalni użytkownicy planu mogą mieć do 35 wykonawców i mogą wybierać spośród następujących opcji zarówno dla kierowcy, jak i wykonawcy:

Konfiguracje sprzętu dla środowisk Spark
Konfiguracja sprzętowa
1 vCPU i 4 GB pamięci RAM
1 vCPU i 8 GB pamięci RAM
1 vCPU i 12 GB pamięci RAM

Współczynnik CUH na godzinę zwiększa się o 0.5 dla każdego dodanego vCPU . Na przykład wartości 1x Driver: 3vCPU with 12GB of RAM i 4x Executors: 2vCPU with 8GB of RAM wynoszą (3 + (4 * 2)) = 11 vCPUs i 5.5 CUH.

Notatniki i środowiska Spark

Ten sam szablon środowiska Spark można wybrać dla więcej niż jednego notatnika. Każdy notatnik powiązany z tym środowiskiem ma własny dedykowany klaster Spark i żadne zasoby nie są współużytkowane.

Po uruchomieniu środowiska Spark potrzebne są dodatkowe zasoby dla demonów procesów roboczych Jupyter Enterprise Gateway, Spark Master i Spark. Te dodatkowe zasoby to 1 vCPU i 2 GB pamięci RAM dla sterownika i 1 GB pamięci RAM dla każdego wykonawcy. Podczas wybierania wielkości sprzętu środowiska Spark należy wziąć pod uwagę te dodatkowe zasoby. Na przykład po utworzeniu komputera notebook i wybraniu opcji Default Spark 3.3 & Python 3.10klaster Spark zużywa 3 vCPU i 12 GB pamięci RAM, ale ponieważ 1 vCPU i 4 GB pamięci RAM są wymagane dla dodatkowych zasobów, zasoby pozostałe dla komputera notebook to 2 vCPU i 8 GB pamięci RAM.

System plików w klastrze Spark

Aby współużytkować pliki między wykonawcami oraz sterownikiem lub jądrem klastra Spark, można użyć współużytkowanego systemu plików o nazwie /home/spark/shared.

Jeśli mają być używane własne biblioteki niestandardowe, można je zapisać w katalogu /home/spark/shared/user-libs/. W katalogu /home/spark/shared/user-libs/ znajdują się cztery podkatalogi, które są wstępnie skonfigurowane do udostępniania w środowiskach wykonawczych języka Python i R lub Java.

Poniższa tabela zawiera listę wstępnie skonfigurowanych podkatalogów, w których można dodać niestandardowe libarie.

Tabela 5. Wstępnie skonfigurowane podkatalogi dla bibliotek niestandardowych
Katalog Typ biblioteki
/home/spark/shared/user-libs/python3/ Biblioteki Python 3
/home/spark/shared/user-libs/R/ Pakiety R
/home/spark/shared/user-libs/spark2/ Pliki JAR Java

Aby współużytkować biblioteki między sterownikiem Spark i wykonawcami:

  1. Pobierz biblioteki niestandardowe lub pliki JAR do odpowiedniego wstępnie skonfigurowanego katalogu.
  2. Zrestartuj jądro z menu notatnika, klikając kolejno opcje Jądro > Restartuj jądro. Spowoduje to załadowanie niestandardowych bibliotek lub plików JAR do środowiska Spark.

Należy zauważyć, że te biblioteki nie są utrwalane. Po zatrzymaniu środowiska wykonawczego i ponownym jego zrestartowaniu należy ponownie załadować biblioteki.

Szablony środowiska GPU

Dla notatników można wybrać następujący szablon środowiska GPU. Szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.

Nazwy szablonów środowiska GPU wskazują moc akceleratora. Szablony środowiska GPU zawierają bibliotekę Watson Natural Language Processing z wstępnie wytrenowanymi modelami dla zadań przetwarzania języka, które można uruchamiać na danych nieustrukturyzowanych. Patrz Korzystanie z biblioteki Watson Natural Language Processing.

~ Wskazuje, że szablon środowiska wymaga planu Watson Studio Professional. Patrz Plany oferty.

Domyślne szablony środowiska GPU dla notatników
Nazwa Konfiguracja sprzętowa Stawka CUH na godzinę
GPU V100 Runtime 22.2 na platformie Python 3.10 ~ 40 vCPU + 172 GB RAM + 1 NVIDIA TESLA V100 (1 GPU) 76
GPU V100 Runtime 23.1 na platformie Python 3.10 ~ 40 vCPU + 172 GB RAM + 1 NVIDIA TESLA V100 (1 GPU) 76
GPU 2xV100 Runtime 22.2 na platformie Python 3.10 ~ 80 vCPU i 344 GB RAM + 2 NVIDIA TESLA V100 (2 GPU) 136
GPU 2xV100 Runtime 23.1 on Python 3.10 ~ 80 vCPU i 344 GB RAM + 2 NVIDIA TESLA V100 (2 GPU) 136

Należy zatrzymać wszystkie aktywne środowiska wykonawcze GPU, gdy nie są już potrzebne, aby zapobiec zużywania dodatkowych godzin pracy jednostki mocy obliczeniowej (CUH). Patrz GPU idle timeout (Limit czasu bezczynności GPU).

Notebooki i środowiska GPU

Środowiska GPU dla komputerów notebook są dostępne tylko w regionie usług IBM Cloud w Dallas.

Ten sam szablon środowiska Python i GPU można wybrać dla więcej niż jednego notatnika w projekcie. W takim przypadku każde jądro notatnika działa w tej samej instancji środowiska wykonawczego i zasoby są współużytkowane. Aby uniknąć współużytkowania zasobów środowiska wykonawczego, należy utworzyć wiele niestandardowych szablonów środowiska z tymi samymi specyfikacjami i powiązać każdy notatnik z własnym szablonem.

Domyślna specyfikacja sprzętu dla modeli oceniania za pomocą usługi Watson Machine Learning

Po wywołaniu w notatniku interfejsu API Watson Machine Learning wykorzystywane są zasoby obliczeniowe z usługi Watson Machine Learning oraz zasoby obliczeniowe dla jądra notebooka.

Podczas nawiązywania połączenia z systemem Watson Machine Learning i tworzenia wdrożenia można wybrać dowolną z następujących specyfikacji sprzętowych.

Specyfikacje sprzętowe dostępne podczas wywoływania usługi Watson Machine Learning w notatniku
Wielkość Konfiguracja sprzętowa Stawka CUH na godzinę
Bardzo mała 1x4 = 1 vCPU i 4 GB pamięci RAM 0.5
Małe 2x8 = 2 vCPU i 8 GB pamięci RAM 1
Średnie 4x16 = 4 vCPU i 16 GB pamięci RAM 2
Duże 8x32 = 8 vCPU i 32 GB pamięci RAM 4

Pliki danych w środowiskach notatników

W przypadku pracy z dużymi zestawami danych należy zapisać zestawy danych w mniejszych porcjach w programie IBM Cloud Object Storage powiązanym z projektem i przetworzyć dane w porcjach w notatniku. Alternatywnie należy uruchomić notatnik w środowisku Spark.

Należy pamiętać, że system plików każdego środowiska wykonawczego jest nietrwały i nie może być współużytkowany w różnych środowiskach. Aby utrwalić pliki w produkcie Watson Studio, należy użyć produktu IBM Cloud Object Storage. Najprostszym sposobem użycia programu IBM Cloud Object Storage w notatnikach w projektach jest wykorzystanie pakietu project-lib dla Python lub pakietu project-lib dla R.

Oblicz użycie według usługi

Środowiska wykonawcze notatnika używają zasobów obliczeniowych jako CUH z produktu Watson Studiopodczas uruchamiania środowisk domyślnych lub niestandardowych. Użytkownik może monitorować wykorzystanie CUH Watson Studio w projekcie na stronie Użycie zasobów na karcie Zarządzanie projektu.

Notebooki mogą również korzystać z CUH z usługi Watson Machine Learning , gdy notebook wywołuje usługę Watson Machine Learning w celu oceny modelu. Na stronie Użycie zasobów na karcie Zarządzanie projektu można monitorować łączne miesięczne wykorzystanie CUH dla usługi Watson Machine Learning .

Śledzenie wykorzystania CUH dla Watson Machine Learning w notatniku

Aby obliczyć jednostkową liczbę godzin mocy obliczeniowej wykorzystywaną przez notatnik, należy uruchomić w notatniku następujący kod:

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Na przykład:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

zwraca wartość 5.49 CUH

Szczegółowe informacje na ten temat zawiera sekcja Instancje usług w dokumentacji interfejsu API IBM Watson Machine Learning .

Zasięg środowiska wykonawczego

Środowiska wykonawcze są zawsze ograniczone do szablonu środowiska i użytkownika w ramach projektu. Jeśli różni użytkownicy w projekcie pracują w tym samym środowisku, każdy użytkownik otrzyma osobne środowisko wykonawcze.

Jeśli zostanie wybrana opcja uruchomienia wersji notatnika jako zaplanowanego zadania, każde zaplanowane zadanie będzie zawsze uruchamiane w dedykowanym środowisku wykonawczym. Środowisko wykonawcze zostanie zatrzymane po zakończeniu zadania.

Zmiana środowiska notatnika

Środowiska można przełączać z różnych powodów, na przykład:

  • Wybierz środowisko z większą mocą obliczeniową lub większą ilością pamięci RAM
  • Zmiana z używania środowiska bez środowiska Spark na środowisko Spark

Środowisko notatnika można zmienić tylko wtedy, gdy notatnik jest odblokowany. Środowisko można zmienić:

  • Z notatnika otwartego w trybie edycji:

    1. Zapisz zmiany wprowadzone w notatniku.
    2. Kliknij ikonę Informacje o notatniku (Ikona Informacje o notatniku) na pasku narzędzi notatnika, a następnie kliknij opcję Środowisko.
    3. Wybierz z listy inny szablon z mocą obliczeniową i pojemnością pamięci.
    4. Wybierz opcję Zmień środowisko. Spowoduje to zatrzymanie aktywnego środowiska wykonawczego i uruchomienie nowo wybranego środowiska.
  • Na stronie Zasoby aplikacyjne projektu:

    1. Wybierz notatnik w sekcji Notebooki, kliknij kolejno opcje Czynności > Zmień środowisko i wybierz inne środowisko. Przed zmianą środowiska należy zatrzymać jądro. Ta nowa instancja środowiska wykonawczego zostanie utworzona przy następnym otwarciu notatnika do edycji.
  • W zadaniu notatnika, edytując szablon zadania. Patrz sekcja Edytowanie ustawień zadania.

Następne kroki

Więcej inform.

Temat nadrzędny: Zasoby obliczeniowe dla narzędzi

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more