Translation not up to date
Po uruchomieniu notatnika w edytorze notatnika w projekcie należy wybrać szablon środowiska, który definiuje zasoby obliczeniowe dla środowiska wykonawczego. Szablon środowiska określa typ, wielkość i moc konfiguracji sprzętu oraz konfigurację oprogramowania. W przypadku notebooków szablony środowiska zawierają obsługiwany język Python i R.
- Typy środowisk
- Wersje środowiska wykonawczego
- Szablony środowiska procesora
- Szablony środowiska Spark
- Szablony środowiska GPU
- Domyślna specyfikacja sprzętu dla modeli oceniania w produkcie Watson Machine Learning
- Pliki danych w środowiskach notatników
- Oblicz użycie według usługi
- Zasięg środowiska wykonawczego
- Zmienianie środowisk
Typy środowisk
W celu uruchomienia notatnika można użyć następujących typów środowisk:
- Środowiska Anaconda CPU dla obciążeń standardowych.
- Środowiska Spark na potrzeby przetwarzania równoległego udostępnianego przez platformę lub inne usługi.
- Środowiska GPU dla modeli uczenia maszynowego intensywnie wykonujących obliczenia.
Większość typów środowisk dla notebooków ma domyślne szablony środowiska, dzięki czemu można szybko rozpocząć pracę. W przeciwnym razie można utworzyć niestandardowe szablony środowiska.
Typ środowiska | Szablony domyślne | Szablony niestandardowe |
---|---|---|
Procesor Anaconda | ✓ | ✓ |
Grupy Spark | ✓ | ✓ |
Procesor graficzny | ✓ | ✓ |
Wersje środowiska wykonawczego
Domyślne środowiska dla notebooków są dodawane jako część wersji środowiska wykonawczego z przedrostkiem Runtime
, po którym następuje rok wydania i wersja wydania.
Wersja środowiska wykonawczego określa listę kluczowych bibliotek analityki danych i wersję językową, na przykład Python 3.10. Wszystkie środowiska w wersji środowiska wykonawczego są budowane na podstawie wersji bibliotek zdefiniowanych w wersji, co zapewnia spójne wykorzystanie bibliotek analityki danych we wszystkich aplikacjach analityki danych.
Wersje Runtime 22.2
i Runtime 23.1
są dostępne dla Python 3.10 i R 4.2.
Chociaż wersja środowiska wykonawczego jest obsługiwana, produkt IBM zaktualizuje wersje bibliotek, aby spełnić wymagania dotyczące bezpieczeństwa. Należy zauważyć, że te aktualizacje nie zmienią wersji <Major>.<Minor>
bibliotek, ale tylko wersji <Patch>
. Dzięki temu zasoby notatnika będą nadal działać.
Pakiety bibliotek dołączone do środowisk wykonawczych
Konkretne wersje popularnych pakietów bibliotek data science zawartych w środowiskach wykonawczych Watson Studio znajdują się w następujących tabelach:
taśmowa | Środowisko wykonawcze 22.2 w środowisku Python 3.10 | Środowisko wykonawcze 23.1 w środowisku Python 3.10 |
---|---|---|
Keras | 2.9 | 2.12 |
Lale | 0.7 | 0.7 |
LightGBM | 3.3 | 3.3 |
NumPy | 1.23 | 1.23 |
ONNX | 1.12 | 1.13 |
Środowisko wykonawcze ONNX | 1.12 | 1.13 |
OpenCV | 4.6 | 4.7 |
Pand | 1.4 | 1.5 |
PyArrow | 8.0 | 11.0 |
PyTorch | 1.12 | 2.0 |
Scikit-nauka | 1.1 | 1.1 |
SciPy | 1.8 | 1.10 |
SnapML | 1.8 | 1.13 |
TensorFlow | 2.9 | 2.12 |
XGBoost | 1.6 | 1.6 |
taśmowa | Środowisko wykonawcze 22.2 na platformie R 4.2 | Środowisko wykonawcze 23.1 na platformie R 4.2 |
---|---|---|
Strzałka | 8.0 | 11.0 |
Samochód | 3.0 | 3.0 |
Znak karetki | 6.0 | 6.0 |
katoole | 1.18 | 1.18 |
prognoza | 8.16 | 8.16 |
ggplot2 | 3.3 | 3.3 |
glmnet | 4.1 | 4.1 |
hmisc | 4.7 | 4.7 |
Keras | 2.9 | 2.12 |
lme4 | 1.1 | 1.1 |
mvtnorm | 1.1 | 1.1 |
pandoc | 2.12 | 2.12 |
psych | 2.2 | 2.2 |
python | 3.10 | 3.10 |
losowy las | 4.7 | 4.7 |
wycofaj | 1.25 | 1.25 |
Kanapka | 3.0 | 3.0 |
Scikit-nauka | 1.1 | 1.1 |
przestrzenne | 7.3 | 7.3 |
tensorflow | 2.9 | 2.12 |
tidyr | 1.2 | 1.2 |
xgboost | 1.6 | 1.6 |
Oprócz bibliotek wymienionych w tabelach środowiska wykonawcze zawierają wiele innych przydatnych bibliotek. Aby wyświetlić pełną listę, należy wybrać kartę Zarządzanie w projekcie, kliknąć opcję Szablony, wybrać kartę Środowiska , a następnie kliknąć jedno z wymienionych środowisk.
Szablony środowiska procesora
Dla notatników można wybrać dowolny z następujących domyślnych szablonów środowiska procesora. Domyślne szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.
DO
Wskazuje, że szablony środowiska zawierają biblioteki CPLEX i DOcplex do modelowania i rozwiązywania problemów z optymalizacją decyzji, które przekraczają złożoność obsługiwaną przez produkt Community Edition bibliotek w innych domyślnych środowiskach Python . Patrz notatnikiDecision Optimization.
NLP
Wskazuje, że szablony środowiska zawierają bibliotekę Watson Natural Language Processing z wstępnie wytrenowanymi modelami dla zadań przetwarzania języka, które można uruchomić na danych nieustrukturyzowanych. Patrz Korzystanie z biblioteki Watson Natural Language Processing. To domyślne środowisko powinno być wystarczająco duże, aby można było uruchamiać wstępnie wytrenowane modele.
Nazwa | Konfiguracja sprzętowa | Stawka CUH na godzinę |
---|---|---|
Środowisko wykonawcze 22.2 w środowisku Python 3.10 XXS | 1 vCPU i 4 GB pamięci RAM | 0.5 |
Środowisko wykonawcze 22.2 w środowisku Python 3.10 XS | 2 vCPU i 8 GB pamięci RAM | 1 |
Środowisko wykonawcze 22.2 w środowisku Python 3.10 | 4 vCPU i 16 GB pamięci RAM | 2 |
Środowisko wykonawcze 23.1 w środowisku Python 3.10 XXS | 1 vCPU i 4 GB pamięci RAM | 0.5 |
Środowisko wykonawcze 23.1 w środowisku Python 3.10 XS | 2 vCPU i 8 GB pamięci RAM | 1 |
Środowisko wykonawcze 23.1 w środowisku Python 3.10 | 4 vCPU i 16 GB pamięci RAM | 2 |
DO + NLP Runtime 22.2 na platformie Python 3.10 XS | 2 vCPU i 8 GB pamięci RAM | 6 |
Środowisko wykonawcze NLP 23.1 na platformie Python 3.10 XS | 2 vCPU i 8 GB pamięci RAM | 6 |
Środowisko wykonawcze 22.2 na platformie R 4.2 | 4 vCPU i 16 GB pamięci RAM | 2 |
Środowisko wykonawcze 23.1 na platformie R 4.2 | 4 vCPU i 16 GB pamięci RAM | 2 |
Należy zatrzymać wszystkie aktywne środowiska wykonawcze CPU, gdy nie są już potrzebne, aby zapobiec zużywaniu dodatkowych jednostek mocy obliczeniowej (CUH). Patrz CPU idle timeout (Limit czasu bezczynności procesora).
Notatniki i środowiska procesora
Po otwarciu notatnika w trybie edycji w środowisku wykonawczym procesora, dokładnie jedna sesja interaktywna łączy się z jądrem Jupyter dla wybranego języka notatnika i środowiska wykonawczego. Środowisko wykonawcze jest uruchamiane dla pojedynczego użytkownika, a nie dla notatnika. Oznacza to, że jeśli zostanie otwarty drugi notatnik z tym samym szablonem środowiska w tym samym projekcie, drugie jądro zostanie uruchomione w tym samym środowisku wykonawczym. Zasoby środowiska wykonawczego są współużytkowane przez jądra Jupyter, które są uruchamiane w środowisku wykonawczym. Zasoby środowiska wykonawczego są również współużytkowane, jeśli procesor ma procesor GPU.
Aby uniknąć współużytkowania środowisk wykonawczych, ale używać tego samego szablonu środowiska dla wielu notatników w projekcie, należy utworzyć niestandardowe szablony środowiska z tymi samymi specyfikacjami i powiązać każdy notatnik z jego własnym szablonem.
W razie potrzeby można zrestartować jądro lub ponownie nawiązać z tym jądrem połączenie. Po zrestartowaniu jądra jest ono zatrzymywane, a następnie ponownie uruchamiane w tej samej sesji, ale wszystkie wyniki wykonania są tracone. Po ponownym nawiązaniu połączenia z jądrem po utracie połączenia notatnik jest połączony z tą samą sesją jądra, a wszystkie poprzednio zapisane wyniki wykonania są dostępne.
Szablony środowiska Spark
Dla notatników można wybrać dowolny z następujących domyślnych szablonów środowiska Spark. Domyślne szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.
Nazwa | Konfiguracja sprzętowa | Stawka CUH na godzinę |
---|---|---|
Domyślny system Spark 3.3 & R 4.2 | 2 Wykonawcy każdy: 1 vCPU i 4 GB RAM; Sterownik: 1 vCPU i 4 GB RAM |
1 |
Domyślny Spark 3.4 & R 4.2 | 2 Wykonawcy każdy: 1 vCPU i 4 GB RAM; Sterownik: 1 vCPU i 4 GB RAM |
1 |
Należy zatrzymać wszystkie aktywne środowiska wykonawcze Spark, gdy nie są one już potrzebne, aby zapobiec zużywaniu dodatkowych jednostek mocy obliczeniowej (CUHs). Patrz Limit czasu bezczynności Spark.
Duże środowiska Spark
Jeśli masz plan Watson Studio Professional, możesz utworzyć niestandardowe szablony środowiska dla większych środowisk Spark.
Profesjonalni użytkownicy planu mogą mieć do 35 wykonawców i mogą wybierać spośród następujących opcji zarówno dla kierowcy, jak i wykonawcy:
Konfiguracja sprzętowa |
---|
1 vCPU i 4 GB pamięci RAM |
1 vCPU i 8 GB pamięci RAM |
1 vCPU i 12 GB pamięci RAM |
Współczynnik CUH na godzinę zwiększa się o 0.5 dla każdego dodanego vCPU . Na przykład wartości 1x Driver: 3vCPU with 12GB of RAM
i 4x Executors: 2vCPU with 8GB of RAM
wynoszą (3 + (4 * 2)) = 11 vCPUs
i 5.5 CUH
.
Notatniki i środowiska Spark
Ten sam szablon środowiska Spark można wybrać dla więcej niż jednego notatnika. Każdy notatnik powiązany z tym środowiskiem ma własny dedykowany klaster Spark i żadne zasoby nie są współużytkowane.
Po uruchomieniu środowiska Spark potrzebne są dodatkowe zasoby dla demonów procesów roboczych Jupyter Enterprise Gateway, Spark Master i Spark. Te dodatkowe zasoby to 1 vCPU i 2 GB pamięci RAM dla sterownika i 1 GB pamięci RAM dla każdego wykonawcy. Podczas wybierania wielkości sprzętu środowiska Spark należy wziąć pod uwagę te dodatkowe zasoby. Na przykład po utworzeniu komputera notebook i wybraniu opcji Default Spark 3.3 & Python 3.10
klaster Spark zużywa 3 vCPU i 12 GB pamięci RAM, ale ponieważ 1 vCPU i 4 GB pamięci RAM są wymagane dla dodatkowych zasobów, zasoby pozostałe dla komputera notebook to 2 vCPU i 8 GB pamięci RAM.
System plików w klastrze Spark
Aby współużytkować pliki między wykonawcami oraz sterownikiem lub jądrem klastra Spark, można użyć współużytkowanego systemu plików o nazwie /home/spark/shared
.
Jeśli mają być używane własne biblioteki niestandardowe, można je zapisać w katalogu /home/spark/shared/user-libs/
. W katalogu /home/spark/shared/user-libs/
znajdują się cztery podkatalogi, które są wstępnie skonfigurowane do udostępniania w środowiskach wykonawczych języka Python i R lub Java.
Poniższa tabela zawiera listę wstępnie skonfigurowanych podkatalogów, w których można dodać niestandardowe libarie.
Katalog | Typ biblioteki |
---|---|
/home/spark/shared/user-libs/python3/ |
Biblioteki Python 3 |
/home/spark/shared/user-libs/R/ |
Pakiety R |
/home/spark/shared/user-libs/spark2/ |
Pliki JAR Java |
Aby współużytkować biblioteki między sterownikiem Spark i wykonawcami:
- Pobierz biblioteki niestandardowe lub pliki JAR do odpowiedniego wstępnie skonfigurowanego katalogu.
- Zrestartuj jądro z menu notatnika, klikając kolejno opcje Jądro > Restartuj jądro. Spowoduje to załadowanie niestandardowych bibliotek lub plików JAR do środowiska Spark.
Należy zauważyć, że te biblioteki nie są utrwalane. Po zatrzymaniu środowiska wykonawczego i ponownym jego zrestartowaniu należy ponownie załadować biblioteki.
Szablony środowiska GPU
Dla notatników można wybrać następujący szablon środowiska GPU. Szablony środowiska są wyświetlane w sekcji Szablony na stronie Środowiska na karcie Zarządzanie projektu.
Nazwy szablonów środowiska GPU wskazują moc akceleratora. Szablony środowiska GPU zawierają bibliotekę Watson Natural Language Processing z wstępnie wytrenowanymi modelami dla zadań przetwarzania języka, które można uruchamiać na danych nieustrukturyzowanych. Patrz Korzystanie z biblioteki Watson Natural Language Processing.
~ Wskazuje, że szablon środowiska wymaga planu Watson Studio Professional. Patrz Plany oferty.
Nazwa | Konfiguracja sprzętowa | Stawka CUH na godzinę |
---|---|---|
GPU V100 Runtime 22.2 na platformie Python 3.10 ~ | 40 vCPU + 172 GB RAM + 1 NVIDIA TESLA V100 (1 GPU) | 76 |
GPU V100 Runtime 23.1 na platformie Python 3.10 ~ | 40 vCPU + 172 GB RAM + 1 NVIDIA TESLA V100 (1 GPU) | 76 |
GPU 2xV100 Runtime 22.2 na platformie Python 3.10 ~ | 80 vCPU i 344 GB RAM + 2 NVIDIA TESLA V100 (2 GPU) | 136 |
GPU 2xV100 Runtime 23.1 on Python 3.10 ~ | 80 vCPU i 344 GB RAM + 2 NVIDIA TESLA V100 (2 GPU) | 136 |
Należy zatrzymać wszystkie aktywne środowiska wykonawcze GPU, gdy nie są już potrzebne, aby zapobiec zużywania dodatkowych godzin pracy jednostki mocy obliczeniowej (CUH). Patrz GPU idle timeout (Limit czasu bezczynności GPU).
Notebooki i środowiska GPU
Środowiska GPU dla komputerów notebook są dostępne tylko w regionie usług IBM Cloud w Dallas.
Ten sam szablon środowiska Python i GPU można wybrać dla więcej niż jednego notatnika w projekcie. W takim przypadku każde jądro notatnika działa w tej samej instancji środowiska wykonawczego i zasoby są współużytkowane. Aby uniknąć współużytkowania zasobów środowiska wykonawczego, należy utworzyć wiele niestandardowych szablonów środowiska z tymi samymi specyfikacjami i powiązać każdy notatnik z własnym szablonem.
Domyślna specyfikacja sprzętu dla modeli oceniania za pomocą usługi Watson Machine Learning
Po wywołaniu w notatniku interfejsu API Watson Machine Learning wykorzystywane są zasoby obliczeniowe z usługi Watson Machine Learning oraz zasoby obliczeniowe dla jądra notebooka.
Podczas nawiązywania połączenia z systemem Watson Machine Learning i tworzenia wdrożenia można wybrać dowolną z następujących specyfikacji sprzętowych.
Wielkość | Konfiguracja sprzętowa | Stawka CUH na godzinę |
---|---|---|
Bardzo mała | 1x4 = 1 vCPU i 4 GB pamięci RAM | 0.5 |
Małe | 2x8 = 2 vCPU i 8 GB pamięci RAM | 1 |
Średnie | 4x16 = 4 vCPU i 16 GB pamięci RAM | 2 |
Duże | 8x32 = 8 vCPU i 32 GB pamięci RAM | 4 |
Pliki danych w środowiskach notatników
W przypadku pracy z dużymi zestawami danych należy zapisać zestawy danych w mniejszych porcjach w programie IBM Cloud Object Storage powiązanym z projektem i przetworzyć dane w porcjach w notatniku. Alternatywnie należy uruchomić notatnik w środowisku Spark.
Należy pamiętać, że system plików każdego środowiska wykonawczego jest nietrwały i nie może być współużytkowany w różnych środowiskach. Aby utrwalić pliki w produkcie Watson Studio, należy użyć produktu IBM Cloud Object Storage. Najprostszym sposobem użycia programu IBM Cloud Object Storage w notatnikach w projektach jest wykorzystanie pakietu project-lib
dla Python lub pakietu project-lib
dla R.
Oblicz użycie według usługi
Środowiska wykonawcze notatnika używają zasobów obliczeniowych jako CUH z produktu Watson Studiopodczas uruchamiania środowisk domyślnych lub niestandardowych. Użytkownik może monitorować wykorzystanie CUH Watson Studio w projekcie na stronie Użycie zasobów na karcie Zarządzanie projektu.
Notebooki mogą również korzystać z CUH z usługi Watson Machine Learning , gdy notebook wywołuje usługę Watson Machine Learning w celu oceny modelu. Na stronie Użycie zasobów na karcie Zarządzanie projektu można monitorować łączne miesięczne wykorzystanie CUH dla usługi Watson Machine Learning .
Śledzenie wykorzystania CUH dla Watson Machine Learning w notatniku
Aby obliczyć jednostkową liczbę godzin mocy obliczeniowej wykorzystywaną przez notatnik, należy uruchomić w notatniku następujący kod:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Na przykład:
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
zwraca wartość 5.49 CUH
Szczegółowe informacje na ten temat zawiera sekcja Instancje usług w dokumentacji interfejsu API IBM Watson Machine Learning .
Zasięg środowiska wykonawczego
Środowiska wykonawcze są zawsze ograniczone do szablonu środowiska i użytkownika w ramach projektu. Jeśli różni użytkownicy w projekcie pracują w tym samym środowisku, każdy użytkownik otrzyma osobne środowisko wykonawcze.
Jeśli zostanie wybrana opcja uruchomienia wersji notatnika jako zaplanowanego zadania, każde zaplanowane zadanie będzie zawsze uruchamiane w dedykowanym środowisku wykonawczym. Środowisko wykonawcze zostanie zatrzymane po zakończeniu zadania.
Zmiana środowiska notatnika
Środowiska można przełączać z różnych powodów, na przykład:
- Wybierz środowisko z większą mocą obliczeniową lub większą ilością pamięci RAM
- Zmiana z używania środowiska bez środowiska Spark na środowisko Spark
Środowisko notatnika można zmienić tylko wtedy, gdy notatnik jest odblokowany. Środowisko można zmienić:
Z notatnika otwartego w trybie edycji:
- Zapisz zmiany wprowadzone w notatniku.
- Kliknij ikonę Informacje o notatniku () na pasku narzędzi notatnika, a następnie kliknij opcję Środowisko.
- Wybierz z listy inny szablon z mocą obliczeniową i pojemnością pamięci.
- Wybierz opcję Zmień środowisko. Spowoduje to zatrzymanie aktywnego środowiska wykonawczego i uruchomienie nowo wybranego środowiska.
Na stronie Zasoby aplikacyjne projektu:
- Wybierz notatnik w sekcji Notebooki, kliknij kolejno opcje Czynności > Zmień środowisko i wybierz inne środowisko. Przed zmianą środowiska należy zatrzymać jądro. Ta nowa instancja środowiska wykonawczego zostanie utworzona przy następnym otwarciu notatnika do edycji.
W zadaniu notatnika, edytując szablon zadania. Patrz sekcja Edytowanie ustawień zadania.
Następne kroki
Więcej inform.
Temat nadrzędny: Zasoby obliczeniowe dla narzędzi