0 / 0
Go back to the English version of the documentation
Watson Machine Learning planuje i oblicza wykorzystanie

Watson Machine Learning planuje i oblicza wykorzystanie

Zasoby Watson Machine Learning , które są mierzone w godzinach jednostki mocy obliczeniowej (CUH), są używane podczas uczenia modeli AutoAI , uruchamiania modeli uczenia maszynowego lub oceny wdrożonych modeli. Zasoby Watson Machine Learning , mierzone w jednostkach zasobów (RU), są używane podczas uruchamiania usług piekielnych przy użyciu modeli fundamentowych. W tym temacie opisano różne plany, jakie można wybrać, jakie usługi są uwzględniane, oraz sposób obliczania zasobów obliczeniowych.

Watson Machine Learning w sekcji Cloud Pak for Data as a Service (Pak for Data as a Service) i watsonx

Ważne:

Plan Watson Machine Learning zawiera szczegółowe informacje na temat watsonx.ai. Watsonx.ai to studio zintegrowanych narzędzi do pracy z generatywną AI, oparte na modelach fundamentów i modelach uczenia maszynowego. Jeśli używana jest usługa Cloud Pak for Data as a Service(Cloud Pak for Data as a Service), to szczegółowe informacje na temat pracy z modelami fundamentowania i podpowiadania pytań o dozowanie przy użyciu jednostek zasobów nie mają zastosowania do Twojego planu.

Więcej informacji na temat watsonx.aimożna znaleźć w:

Jeśli włączono obsługę zarówno dla watsonx , jak i Cloud Pak for Data as a Service, można przełączać się między dwoma platformami.

Wybór planu Watson Machine Learning

Wyświetl porównanie planów i zastanów się nad szczegółami, aby wybrać plan, który odpowiada Twoim potrzebom.

Plany Watson Machine Learning

Plany Watson Machine Learning określają sposób naliczania opłaty za modele, które można trenować i wdrażać za pomocą usługi Watson Machine Learning , a także w przypadku pytań, które są używane z modelami fundamentowania. Wybierz plan w oparciu o Twoje potrzeby:

  • Lite to bezpłatny plan o ograniczonej mocy obliczeniowej. Ten plan należy wybrać, jeśli Watson Machine Learning ma być oceniany i chcesz wypróbować możliwości.
  • Essentials to plan pay-as-you-go, który zapewnia elastyczność budowania, wdrażania i zarządzania modelami w celu dopasowania ich do potrzeb użytkownika.
  • Standard to plan korporacyjny o wysokiej wydajności, który został zaprojektowany w celu obsługi wszystkich potrzeb w zakresie uczenia maszynowego w organizacji. Godziny jednostki mocy obliczeniowej są dostępne w postaci stawki zryczałtowanego, podczas gdy jednostkowe wykorzystanie zasobów jest płacone za pomocą opcji "pay-as-you-go".

Szczegółowe informacje na temat planowania i ustalania cen zawiera sekcja IBM Cloud Machine Learning.

Godziny jednostki mocy obliczeniowej (CUH), tokeny i jednostki zasobów (RU)

W celu mierzenia i fakturowania, modele uczenia maszynowego oraz wdrożenia lub modele fundamentowe są mierzone z następującymi jednostkami:

  • Godziny jednostki mocy obliczeniowej (CUH) mierzy zużycie zasobów na godzinę jednostkową w celach związanych z użytkiem i fakturowaniem. CUH mierzy wszystkie działania Watson Machine Learning z wyjątkiem wnioskowania modelu Foundation.

  • Jednostki zasobów (RU) mierzy zużycie modelu fundamentowego. Wnioskowanie jest procesem wywoływania modelu fundamentów w celu wygenerowania danych wyjściowych w odpowiedzi na pytanie. Każdy RU jest równy 1000 tokenów. Token jest podstawową jednostką tekstową (zwykle 4 znaki lub 0.75 wyrazami) używaną w danych wejściowych lub wyjściowych dla podpowiedzi modelu fundacji. Wybierz plan, który odpowiada wymaganiom dot. użycia. Szczegółowe informacje na temat tokenów można znaleźć w sekcji Tokeny i tokenizacja.

  • Limit szybkości monitoruje i ogranicza liczbę żądań wnioskowania na sekundę przetwarzanych dla modeli podstawowych dla danej instancji planu Watson Machine Learning . Limit stawki jest wyższy w przypadku płatnych planów niż w przypadku bezpłatnego planu Lite.

Szczegóły planu Watson Machine Learning

Plan Lite zawiera wystarczającą ilość wolnych zasobów, aby można było ocenić możliwości programu watsonx.ai. Następnie można wybrać płatny plan, który jest zgodny z potrzebami organizacji, w oparciu o opcje planu i wielkość.

Tabela 1. Szczegóły planu
Opcje planu Lite Kluczowe funkcje Standardowy produkt
Użycie Machine Learning w CUH 20 CUH na miesiąc Rozliczenie CUH oparte na stopie CUH pomnożone przez godziny zużycia 2500 CUH na miesiąc
Wnioskowanie modelu fundamentów w tokenach lub jednostkach zasobów (RU) 50 000 tokenów na miesiąc Zafakturow dla użycia (1000 tokenów = 1 RU) Zafakturow dla użycia (1000 tokenów = 1 RU)
Maksymalna liczba równoległych zadań wsadowych Decision Optimization na wdrożenie 2 5 100
Liczba zatrzymanych zadań wdrażania w obszarze 100 1000 3000
Czas wdrożenia w trybie bezczynności 1 dzień 3 dni 3 dni
Obsługa HIPAA ND ND Tylko region Dallas
musi być włączony na koncieIBM Cloud
Limit częstotliwości na identyfikator planu 2 żądania wnioskowania na sekundę 8 żądań wnioskowania na sekundę 8 żądań wnioskowania na sekundę

Uwaga: W przypadku aktualizacji z wersji Essentials do Standard nie można powrócić do planu Essentials. Należy utworzyć nowy plan.

Dla wszystkich planów:

  • Do wnioskowania Lab inferencing, w tym wejścia i wyjścia, można użyć modelu Fundational Model inferencing Resource Units (RU). Oznacza to, że podpowiedź wprowadzana dla danych wejściowych jest liczona poza wygenerowanym wyjściem. (tylkowatsonx )
  • Wnioskowanie modelu fundamentowego jest dostępne tylko dla centrów przetwarzania danych w Dallas i Frankfurcie. (tylkowatsonx )
  • Trzy klasy modelu określają szybkość RU. Cena na RU różni się w zależności od klasy modelu. (tylkowatsonx )
  • Współczynnik mocy obliczeniowej na godzinę (CUH) przeznaczony na szkolenie jest oparty na narzędziu szkoleniowym, specyfikacji sprzętu i środowisku wykonawczym.
  • Wykorzystanie mocy obliczeniowej na godzinę (CUH) dla wdrożenia jest oparte na typie wdrożenia, specyfikacji sprzętu i specyfikacji oprogramowania.
  • Watson Machine Learning określa limity liczby zadań wdrażania zatrzymanych dla każdego miejsca wdrożenia. Jeśli limit zostanie przekroczony, nie będzie można tworzyć nowych zadań wdrażania do czasu usunięcia istniejących zadań lub zaktualizowania planu. Domyślnie metadane zadań będą automatycznie usuwane po 30 dniach. Tę wartość można przesłonić podczas tworzenia zadania. Patrz sekcja Zarządzanie zadaniami.
  • Czas do bezczynności odnosi się do czasu, jaki należy uwzględnić podczas wdrażania, które jest aktywne między żądaniami oceniania. Jeśli wdrożenie nie otrzyma żądań oceniania dla danego przedziału czasu, jest ono traktowane jako nieaktywne, bezczynne, a fakturowanie jest zatrzymywane dla wszystkich środowisk innych niż SPSS.
  • Plan dopuszcza co najmniej określony limit szybkości, a rzeczywisty limit szybkości może być wyższy niż określony limit. Na przykład plan Lite może przetwarzać więcej niż 2 żądania na sekundę bez generowania błędu. Jeśli masz płatny plan i uważasz, że osiągasz limit częstotliwości błędów, skontaktuj się z działem wsparcia IBM , aby uzyskać pomoc.

Szczegółowe informacje na temat planowania i ustalania cen zawiera sekcja IBM Cloud Machine Learning.

Pomiar jednostki zasobów (watsonx)

Fakturowanie jednostek zasobów jest oparte na stopie klasy fakturowania dla modelu Foundation multipled przez liczbę jednostek zasobów (Resource Units-RU). Jednostka zasobów jest równa 1000 tokenów z wejścia i wyjścia modelu fundamentowania. Trzy klasy fakturowania modelu fundacji mają różne stawki RU.

operacyjny Początek Klasa fakturowania Cena za RU
granite-13b-instruct-v1 IBM Klasa 3 $0.0050 na RU
granite-13b-chat-v1 IBM Klasa 3 $0.0050 na RU
flan-t5-xxl-11b Open source Klasa 2 $0.0018 na RU
flan-ul2-20b Open source Klasa 3 $0.0050 na RU
gpt-neox-20b Open source Klasa 3 $0.0050 na RU
llama-2-13b-chat Open source Klasa 2 $0.0018 na RU
llama-2-70b-chat Open source Klasa 3 $0.0050 na RU
mpt-7b-instruct2 Open source Klasa 1 $0.0006 na RU
mt0-xxl-13b Open source Klasa 2 $0.0018 na RU
starcoder-15.5b Open source Klasa 2 $0.0018 na RU

Więcej informacji na temat każdego modelu znajduje się w sekcji Obsługiwane modele fundamentów. Informacje na temat wsparcia regionalnego dla każdego modelu zawiera sekcja Dostępność regionalna dla modeli podstawowych.

Uwaga: Znaczniki nie są używane, gdy używana jest aplikacja generacyjna do wyszukiwania i odpowiedzi AI dla tego serwisu dokumentacji.

Mierzenie godzin jednostek mocy obliczeniowej (watsonx i Watson Machine Learning)

Wykorzystanie zasobów sprzętowych obliczeniowych dla zadania oraz innych czynników, takich jak specyfikacja oprogramowania i typ modelu, wpływa na konsumpcję CUH.

Wskaźniki zużycia CUH według rodzaju aktywów

Tabela 3. Wskaźniki zużycia CUH według rodzaju aktywów
Typ zasobu Typ wielkości Jednostki mocy obliczeniowej na godzinę
Eksperyment AutoAI 8 vCPU i 32 GB pamięci RAM 20
Szkolenie Decision Optimization 2 vCPU i 8 GB pamięci RAM
4 vCPU i 16 GB pamięci RAM
8 vCPU i 32 GB pamięci RAM
16 vCPU i 64 GB pamięci RAM
6
7
9
13
Wdrożenia Decision Optimization 2 vCPU i 8 GB pamięci RAM
4 vCPU i 16 GB pamięci RAM
8 vCPU i 32 GB pamięci RAM
16 vCPU i 64 GB pamięci RAM
30
40
50
60
Modele Machine Learning
(szkolenie, ocenianie lub ocenianie)
1 vCPU i 4 GB pamięci RAM
2 vCPU i 8 GB pamięci RAM
4 vCPU i 16 GB pamięci RAM
8 vCPU i 32 GB pamięci RAM
16 vCPU i 64 GB pamięci RAM
0.5
1
2
4
8

Zużycie CUH według wdrożenia i typu środowiska

Wykorzystanie CUH dla wdrożeń jest obliczane przy użyciu następujących formuł:

Tabela 4. Zużycie CUH według wdrożenia i typu środowiska
Typ wdrożenia Środowisko Obliczenie CUH
Z połączeniem AutoAI, funkcje i skrypty Python , SPSS, Scikit-Ucz się bibliotek niestandardowych, Tensorflow, RShiny deployment_active_duration * no_of_nodes * CUH_rate_for_capacity_type_framework
Z połączeniem Spark, PMML, Scikit-Learn, Pytorch, XGBoost score_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework
wsadowo wszystkie środowiska job_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework

Monitorowanie wykorzystania zasobów

Użytkownik może śledzić użycie opcji CUH lub RU dla zasobów, których właścicielem jest użytkownik, lub współpracować w projekcie lub w obszarze. Jeśli jesteś właścicielem konta lub administratorem, możesz śledzić użycie opcji CUH lub RU dla całego konta.

Śledzenie wykorzystania CUH lub RU w projekcie

Aby monitorować zużycie CUH lub RU w projekcie:

  1. Przejdź do karty Zarządzanie dla projektu.

  2. Kliknij opcję Zasoby , aby przejrzeć podsumowanie wykorzystania zasobów dla zasobów w projekcie lub obszarze albo aby przejrzeć szczegóły wykorzystania zasobów dla konkretnych zasobów.

    Śledzenie zasobów w projekcie

Śledzenie użycia CUH dla konta

Wykorzystanie środowiska wykonawczego dla konta można śledzić na stronie Środowisko wykonawcze środowiska , jeśli jest to właściciel konta IBM Cloud lub administrator lub właściciel usługi Watson Machine Learning . Szczegółowe informacje na ten temat zawiera sekcja Zasoby monitorowania.

Śledzenie zużycia CUH dla uczenia maszynowego w notatniku

Aby obliczyć liczbę godzin jednostki pojemności w notatniku, należy użyć następującej komendy:

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Na przykład:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

zwraca 5.49 CUH

Szczegółowe informacje na ten temat można znaleźć w sekcji Instancje usług w dokumentacji IBM Watson Machine Learning API .

Więcej inform.

Temat nadrzędny: Watson Machine Learning

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more