Translation not up to date
Zasoby Watson Machine Learning , które są mierzone w godzinach jednostki mocy obliczeniowej (CUH), są używane podczas uczenia modeli AutoAI , uruchamiania modeli uczenia maszynowego lub oceny wdrożonych modeli. Zasoby Watson Machine Learning , mierzone w jednostkach zasobów (RU), są używane podczas uruchamiania usług piekielnych przy użyciu modeli fundamentowych. W tym temacie opisano różne plany, jakie można wybrać, jakie usługi są uwzględniane, oraz sposób obliczania zasobów obliczeniowych.
Watson Machine Learning w sekcji Cloud Pak for Data as a Service (Pak for Data as a Service) i watsonx
Plan Watson Machine Learning zawiera szczegółowe informacje na temat watsonx.ai. Watsonx.ai to studio zintegrowanych narzędzi do pracy z generatywną AI, oparte na modelach fundamentów i modelach uczenia maszynowego. Jeśli używana jest usługa Cloud Pak for Data as a Service(Cloud Pak for Data as a Service), to szczegółowe informacje na temat pracy z modelami fundamentowania i podpowiadania pytań o dozowanie przy użyciu jednostek zasobów nie mają zastosowania do Twojego planu.
Więcej informacji na temat watsonx.aimożna znaleźć w:
- Przegląd produktu IBM watsonx.ai
- Porównanie produktów IBM watsonx i Cloud Pak for Data as a Service
- Zalogowanie się do systemu IBM watsonx.ai
Jeśli włączono obsługę zarówno dla watsonx , jak i Cloud Pak for Data as a Service, można przełączać się między dwoma platformami.
Wybór planu Watson Machine Learning
Wyświetl porównanie planów i zastanów się nad szczegółami, aby wybrać plan, który odpowiada Twoim potrzebom.
- Watson Machine Learning -plany
- Godziny jednostki mocy obliczeniowej (CUH), tokeny i jednostki zasobów (RU)
- Szczegóły planu Watson Machine Learning
- Miernik godziny jednostki mocy obliczeniowej
- Monitorowanie wykorzystania CUH i RU
Plany Watson Machine Learning
Plany Watson Machine Learning określają sposób naliczania opłaty za modele, które można trenować i wdrażać za pomocą usługi Watson Machine Learning , a także w przypadku pytań, które są używane z modelami fundamentowania. Wybierz plan w oparciu o Twoje potrzeby:
- Lite to bezpłatny plan o ograniczonej mocy obliczeniowej. Ten plan należy wybrać, jeśli Watson Machine Learning ma być oceniany i chcesz wypróbować możliwości.
- Essentials to plan pay-as-you-go, który zapewnia elastyczność budowania, wdrażania i zarządzania modelami w celu dopasowania ich do potrzeb użytkownika.
- Standard to plan korporacyjny o wysokiej wydajności, który został zaprojektowany w celu obsługi wszystkich potrzeb w zakresie uczenia maszynowego w organizacji. Godziny jednostki mocy obliczeniowej są dostępne w postaci stawki zryczałtowanego, podczas gdy jednostkowe wykorzystanie zasobów jest płacone za pomocą opcji "pay-as-you-go".
Szczegółowe informacje na temat planowania i ustalania cen zawiera sekcja IBM Cloud Machine Learning.
Godziny jednostki mocy obliczeniowej (CUH), tokeny i jednostki zasobów (RU)
W celu mierzenia i fakturowania, modele uczenia maszynowego oraz wdrożenia lub modele fundamentowe są mierzone z następującymi jednostkami:
Godziny jednostki mocy obliczeniowej (CUH) mierzy zużycie zasobów na godzinę jednostkową w celach związanych z użytkiem i fakturowaniem. CUH mierzy wszystkie działania Watson Machine Learning z wyjątkiem wnioskowania modelu Foundation.
Jednostki zasobów (RU) mierzy zużycie modelu fundamentowego. Wnioskowanie jest procesem wywoływania modelu fundamentów w celu wygenerowania danych wyjściowych w odpowiedzi na pytanie. Każdy RU jest równy 1000 tokenów. Token jest podstawową jednostką tekstową (zwykle 4 znaki lub 0.75 wyrazami) używaną w danych wejściowych lub wyjściowych dla podpowiedzi modelu fundacji. Wybierz plan, który odpowiada wymaganiom dot. użycia. Szczegółowe informacje na temat tokenów można znaleźć w sekcji Tokeny i tokenizacja.
Limit szybkości monitoruje i ogranicza liczbę żądań wnioskowania na sekundę przetwarzanych dla modeli podstawowych dla danej instancji planu Watson Machine Learning . Limit stawki jest wyższy w przypadku płatnych planów niż w przypadku bezpłatnego planu Lite.
Szczegóły planu Watson Machine Learning
Plan Lite zawiera wystarczającą ilość wolnych zasobów, aby można było ocenić możliwości programu watsonx.ai. Następnie można wybrać płatny plan, który jest zgodny z potrzebami organizacji, w oparciu o opcje planu i wielkość.
Opcje planu | Lite | Kluczowe funkcje | Standardowy produkt |
---|---|---|---|
Użycie Machine Learning w CUH | 20 CUH na miesiąc | Rozliczenie CUH oparte na stopie CUH pomnożone przez godziny zużycia | 2500 CUH na miesiąc |
Wnioskowanie modelu fundamentów w tokenach lub jednostkach zasobów (RU) | 50 000 tokenów na miesiąc | Zafakturow dla użycia (1000 tokenów = 1 RU) | Zafakturow dla użycia (1000 tokenów = 1 RU) |
Maksymalna liczba równoległych zadań wsadowych Decision Optimization na wdrożenie | 2 | 5 | 100 |
Liczba zatrzymanych zadań wdrażania w obszarze | 100 | 1000 | 3000 |
Czas wdrożenia w trybie bezczynności | 1 dzień | 3 dni | 3 dni |
Obsługa HIPAA | ND | ND | Tylko region Dallas musi być włączony na koncieIBM Cloud |
Limit częstotliwości na identyfikator planu | 2 żądania wnioskowania na sekundę | 8 żądań wnioskowania na sekundę | 8 żądań wnioskowania na sekundę |
Dla wszystkich planów:
- Do wnioskowania Lab inferencing, w tym wejścia i wyjścia, można użyć modelu Fundational Model inferencing Resource Units (RU). Oznacza to, że podpowiedź wprowadzana dla danych wejściowych jest liczona poza wygenerowanym wyjściem. (tylkowatsonx )
- Wnioskowanie modelu fundamentowego jest dostępne tylko dla centrów przetwarzania danych w Dallas i Frankfurcie. (tylkowatsonx )
- Trzy klasy modelu określają szybkość RU. Cena na RU różni się w zależności od klasy modelu. (tylkowatsonx )
- Współczynnik mocy obliczeniowej na godzinę (CUH) przeznaczony na szkolenie jest oparty na narzędziu szkoleniowym, specyfikacji sprzętu i środowisku wykonawczym.
- Wykorzystanie mocy obliczeniowej na godzinę (CUH) dla wdrożenia jest oparte na typie wdrożenia, specyfikacji sprzętu i specyfikacji oprogramowania.
- Watson Machine Learning określa limity liczby zadań wdrażania zatrzymanych dla każdego miejsca wdrożenia. Jeśli limit zostanie przekroczony, nie będzie można tworzyć nowych zadań wdrażania do czasu usunięcia istniejących zadań lub zaktualizowania planu. Domyślnie metadane zadań będą automatycznie usuwane po 30 dniach. Tę wartość można przesłonić podczas tworzenia zadania. Patrz sekcja Zarządzanie zadaniami.
- Czas do bezczynności odnosi się do czasu, jaki należy uwzględnić podczas wdrażania, które jest aktywne między żądaniami oceniania. Jeśli wdrożenie nie otrzyma żądań oceniania dla danego przedziału czasu, jest ono traktowane jako nieaktywne, bezczynne, a fakturowanie jest zatrzymywane dla wszystkich środowisk innych niż SPSS.
- Plan dopuszcza co najmniej określony limit szybkości, a rzeczywisty limit szybkości może być wyższy niż określony limit. Na przykład plan Lite może przetwarzać więcej niż 2 żądania na sekundę bez generowania błędu. Jeśli masz płatny plan i uważasz, że osiągasz limit częstotliwości błędów, skontaktuj się z działem wsparcia IBM , aby uzyskać pomoc.
Szczegółowe informacje na temat planowania i ustalania cen zawiera sekcja IBM Cloud Machine Learning.
Pomiar jednostki zasobów (watsonx)
Fakturowanie jednostek zasobów jest oparte na stopie klasy fakturowania dla modelu Foundation multipled przez liczbę jednostek zasobów (Resource Units-RU). Jednostka zasobów jest równa 1000 tokenów z wejścia i wyjścia modelu fundamentowania. Trzy klasy fakturowania modelu fundacji mają różne stawki RU.
operacyjny | Początek | Klasa fakturowania | Cena za RU |
---|---|---|---|
granite-13b-instruct-v1 | IBM | Klasa 3 | $0.0050 na RU |
granite-13b-chat-v1 | IBM | Klasa 3 | $0.0050 na RU |
flan-t5-xxl-11b | Open source | Klasa 2 | $0.0018 na RU |
flan-ul2-20b | Open source | Klasa 3 | $0.0050 na RU |
gpt-neox-20b | Open source | Klasa 3 | $0.0050 na RU |
llama-2-13b-chat | Open source | Klasa 2 | $0.0018 na RU |
llama-2-70b-chat | Open source | Klasa 3 | $0.0050 na RU |
mpt-7b-instruct2 | Open source | Klasa 1 | $0.0006 na RU |
mt0-xxl-13b | Open source | Klasa 2 | $0.0018 na RU |
starcoder-15.5b | Open source | Klasa 2 | $0.0018 na RU |
Więcej informacji na temat każdego modelu znajduje się w sekcji Obsługiwane modele fundamentów. Informacje na temat wsparcia regionalnego dla każdego modelu zawiera sekcja Dostępność regionalna dla modeli podstawowych.
Mierzenie godzin jednostek mocy obliczeniowej (watsonx i Watson Machine Learning)
Wykorzystanie zasobów sprzętowych obliczeniowych dla zadania oraz innych czynników, takich jak specyfikacja oprogramowania i typ modelu, wpływa na konsumpcję CUH.
Wskaźniki zużycia CUH według rodzaju aktywów
Typ zasobu | Typ wielkości | Jednostki mocy obliczeniowej na godzinę |
---|---|---|
Eksperyment AutoAI | 8 vCPU i 32 GB pamięci RAM | 20 |
Szkolenie Decision Optimization | 2 vCPU i 8 GB pamięci RAM 4 vCPU i 16 GB pamięci RAM 8 vCPU i 32 GB pamięci RAM 16 vCPU i 64 GB pamięci RAM |
6 7 9 13 |
Wdrożenia Decision Optimization | 2 vCPU i 8 GB pamięci RAM 4 vCPU i 16 GB pamięci RAM 8 vCPU i 32 GB pamięci RAM 16 vCPU i 64 GB pamięci RAM |
30 40 50 60 |
Modele Machine Learning (szkolenie, ocenianie lub ocenianie) |
1 vCPU i 4 GB pamięci RAM 2 vCPU i 8 GB pamięci RAM 4 vCPU i 16 GB pamięci RAM 8 vCPU i 32 GB pamięci RAM 16 vCPU i 64 GB pamięci RAM |
0.5 1 2 4 8 |
Zużycie CUH według wdrożenia i typu środowiska
Wykorzystanie CUH dla wdrożeń jest obliczane przy użyciu następujących formuł:
Typ wdrożenia | Środowisko | Obliczenie CUH |
---|---|---|
Z połączeniem | AutoAI, funkcje i skrypty Python , SPSS, Scikit-Ucz się bibliotek niestandardowych, Tensorflow, RShiny | deployment_active_duration * no_of_nodes * CUH_rate_for_capacity_type_framework |
Z połączeniem | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework |
wsadowo | wszystkie środowiska | job_duration_in_seconds * no_of_nodes * CUH_rate_for_capacity_type_framework |
Monitorowanie wykorzystania zasobów
Użytkownik może śledzić użycie opcji CUH lub RU dla zasobów, których właścicielem jest użytkownik, lub współpracować w projekcie lub w obszarze. Jeśli jesteś właścicielem konta lub administratorem, możesz śledzić użycie opcji CUH lub RU dla całego konta.
Śledzenie wykorzystania CUH lub RU w projekcie
Aby monitorować zużycie CUH lub RU w projekcie:
Przejdź do karty Zarządzanie dla projektu.
Kliknij opcję Zasoby , aby przejrzeć podsumowanie wykorzystania zasobów dla zasobów w projekcie lub obszarze albo aby przejrzeć szczegóły wykorzystania zasobów dla konkretnych zasobów.
Śledzenie użycia CUH dla konta
Wykorzystanie środowiska wykonawczego dla konta można śledzić na stronie Środowisko wykonawcze środowiska , jeśli jest to właściciel konta IBM Cloud lub administrator lub właściciel usługi Watson Machine Learning . Szczegółowe informacje na ten temat zawiera sekcja Zasoby monitorowania.
Śledzenie zużycia CUH dla uczenia maszynowego w notatniku
Aby obliczyć liczbę godzin jednostki pojemności w notatniku, należy użyć następującej komendy:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Na przykład:
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
zwraca 5.49 CUH
Szczegółowe informacje na ten temat można znaleźć w sekcji Instancje usług w dokumentacji IBM Watson Machine Learning API .
Więcej inform.
Temat nadrzędny: Watson Machine Learning