Translation not up to date
Plány a výpočetní využití produktu Watson Machine Learning
Použijte prostředky produktu Watson Machine Learning , které se měří v jednotkách kapacity jednotky kapacity (CUH), když cvičíte modely AutoAI , spustíte modelové výukové modely nebo modelové implementované modely. Použijte prostředky Watson Machine Learning , měřené v jednotkách prostředků (RU), když spouštíte dedukce služeb se základními modely. Toto téma popisuje různé plány, které si můžete vybrat, jaké služby jsou zahrnuty a jak se počítají výpočetní prostředky.
Watson Machine Learning v Cloud Pak for Data as a Service a watsonx
Plán Watson Machine Learning obsahuje podrobnosti o souboru watsonx.ai. Watsonx.ai je studio integrovaných nástrojů pro práci s generativními AI, poháněných modelovými modely a modely strojového učení. Používáte-li produkt Cloud Pak for Data as a Service, pak se podrobnosti pro práci s modely základů a s výzvou k měření měření pomocí prostředků Resource Units na váš plán nevztahují.
Další informace o souboru watsonx.aiviz:
- Přehled o IBM watsonx.ai
- Porovnání systémů IBM watsonx a Cloud Pak for Data as a Service
- Registrování pro produkt IBM watsonx.ai
Pokud jste povolili pro watsonx i Cloud Pak for Data as a Service, můžete přepínat mezi těmito dvěma platformami.
Výběr plánu produktu Watson Machine Learning
Zobrazte si porovnání plánů a zvažte podrobnosti k výběru plánu, který vyhovuje vašim potřebám.
- Plány produktuWatson Machine Learning
- Hodiny jednotkové kapacity (CUH), tokeny a jednotky prostředků (RU)
- Podrobnosti plánu produktuWatson Machine Learning
- Měření hodin jednotky kapacity
- Monitorování využití CUH a RU
Plány produktu Watson Machine Learning
Plány produktu Watson Machine Learning řídí, jak jste vyfakturovány pro modely, které cvičíte a implementujete pomocí produktu Watson Machine Learning a pro výzvy, které používáte se modely základů. Zvolte si plán na základě svých potřeb:
- Lite je volný plán s omezenou kapacitou. Tento plán vyberte v případě, že hodnotíte produkt Watson Machine Learning a chcete vyzkoušet schopnosti.
- Hlavní informace je plán podpory, který vám poskytuje flexibilitu při sestavování, implementaci a správě modelů, které odpovídají vašim potřebám.
- Standard je podnikový plán vysoké kapacity, který je navržen tak, aby podporoval všechny potřeby výuky počítačů v organizaci. Hodiny jednotkové kapacity se poskytují v paušální sazbě, zatímco spotřeba jednotky prostředků je placena-jak-vy-vy-jít.
Podrobnosti plánu a stanovení ceny najdete v tématu IBM Cloud Machine Learning.
Hodiny jednotkové kapacity (CUH), tokeny a jednotky prostředků (RU)
Pro účely měření a fakturace se měří strojové modelové modely a implementace nebo základní modely s těmito jednotkami:
Hodiny jednotky kapacity (CUH) měří spotřebu výpočetních prostředků za jednotku času pro účely použití a účtování. Hodnota CUH měří všechny aktivity produktu Watson Machine Learning s výjimkou základního modelu Foundation Inferencing.
Jednotky prostředků (RU) měří základní model spotřeby dedukcí. Inference je proces volání základního modelu za účelem generování výstupu v odpovědi na výzvu k zadání. Každý stojanová jednotka se rovná 1000 tokenů. Token je základní jednotka textu (obvykle 4 znaky nebo 0.75 slov) použitá ve vstupu nebo výstupu pro výzvu k zadání modelu základů. Zvolte plán, který odpovídá vašim požadavkům na použití. Podrobné informace o tokenech naleznete v tématu Tokeny a tokenizace.
Limit četnosti monitoruje a omezuje počet požadavků na odvozování za sekundu zpracovaných pro základní modely pro danou instanci plánu Watson Machine Learning . Limit sazeb je vyšší u placených plánů než u bezplatného plánu Lite.
Podrobnosti plánu produktu Watson Machine Learning
Jednoduchý plán poskytuje dostatek volných prostředků, abyste mohli vyhodnotit schopnosti watsonx.ai. Poté můžete zvolit placený plán, který odpovídá potřebám vaší organizace, a to na základě funkcí a kapacity plánu.
Funkce plánu | Lite | Essentials | Standardní |
---|---|---|---|
Využití Machine Learning v CUH | 20 CUH měsíčně | Účtování CUH založené na sazbě CUH vynásobené dobou spotřeby | 2500 CUH za měsíc |
Odpor modelu Foundation v tokenech nebo jednotkách prostředků (RU) | 50 000 tokenů za měsíc | Účtováno pro použití (1000 tokenů = 1 RU) | Účtováno pro použití (1000 tokenů = 1 RU) |
Maximální paralelní dávkové úlohy Decision Optimization pro každou implementaci | 2 | 5 | 100 |
Zachované úlohy implementace za prostor | 100 | 1000 | 3000 |
Doba implementace do nečinnosti | 1 den | 3 dny | 3 dny |
Podpora HIPAA | NEDEF | NEDEF | Pouze oblast Dallas Musí být povolena ve vašem účtu IBM Cloud |
Omezení četnosti na ID plánu | 2 požadavky na odvozování za sekundu | 8 požadavků na odvozování za sekundu | 8 požadavků na odvozování za sekundu |
Pro všechny plány:
- Základní model Inferencing Resource Units (RU) lze použít pro dereferenci testovacího pracoviště výzvy k zadání, včetně vstupu a výstupu. To znamená, že výzva, kterou jste zadali pro vstup, se počítá jako dodatek k generovanému výstupu. (pouzewatsonx )
- Inference modelového modelu je k dispozici pouze pro datová centra v Dallasu a Frankfurtu. (pouzewatsonx )
- Rychlost RU určují tři třídy modelu. Cena za RU se liší podle třídy modelu. (pouzewatsonx )
- Spotřeba kapacity jednotky jednotková hodina (CUH) pro školení je založena na školicím nástroji, specifikaci hardwaru a běhovém prostředí.
- Spotřeba kapacity jednotky jednotková kapacita (CUH) pro implementaci je založena na typu implementace, specifikaci hardwaru a specifikaci softwaru.
- Produkt Watson Machine Learning uvádí omezení počtu úloh implementace uchovaných pro jednotlivé prostory implementace. Pokud překročíte limit, nemůžete vytvořit nové úlohy implementace, dokud neodstraníte existující úlohy nebo neupgradujete svůj plán. Při výchozím nastavení budou metadata úloh automaticky odstraněna po 30 dnech. Tuto hodnotu můžete přepsat při vytváření úlohy. Viz Správa úloh.
- Doba do nečinnosti odkazuje na dobu, po kterou se má zvážit implementace aktivní mezi požadavky na přidělení skóre. Pokud implementace neobdrží požadavky na přidělení skóre pro danou dobu trvání, je považována za neaktivní nebo nečinná a účtování se zastaví pro všechny rámce jiné než SPSS.
- Plán umožňuje alespoň stanovený limit sazby a skutečný limit sazby může být vyšší než uvedený limit. Například plán Lite může zpracovat více než 2 požadavky za sekundu bez zadání chyby. Pokud máte placený plán a domníváte se, že jste dosáhli chybného limitu sazeb, obraťte se na podporu IBM se žádostí o pomoc.
Podrobnosti plánu a stanovení ceny najdete v tématu IBM Cloud Machine Learning.
Měření jednotek prostředků (watsonx)
Účtování jednotek prostředků je založeno na rychlosti účtovací třídy pro základní model vynásobený počtem jednotek RVU (Resource Units). Jednotka prostředku se rovná 1000 tokenům ze vstupu a výstupu z dedukcí modelu základní nabídky. Třídační třídy modelu základny mají různé sazby RU.
Model | Původ | Účtovací třída | Cena za jednotku RU |
---|---|---|---|
granite-13b-instruct-v1 | IBM | Třída 3 | $0.0050 na RU |
granite-13b-chat-v1 | IBM | Třída 3 | $0.0050 na RU |
flan-t5-xxl-11b | otevřený zdrojový kód | Třída 2 | $0.0018 na RU |
flan-ul2-20b | otevřený zdrojový kód | Třída 3 | $0.0050 na RU |
gpt-neox-20b | otevřený zdrojový kód | Třída 3 | $0.0050 na RU |
llama-2-13b-chat | otevřený zdrojový kód | Třída 2 | $0.0018 na RU |
llama-2-70b-chat | otevřený zdrojový kód | Třída 3 | $0.0050 na RU |
mpt-7b-instruct2 | otevřený zdrojový kód | Třída 1 | $0.0006 na RU |
mt0-xxl-13b | otevřený zdrojový kód | Třída 2 | $0.0018 na RU |
starcoder-15.5b | otevřený zdrojový kód | Třída 2 | $0.0018 na RU |
Další informace o každém modelu najdete v tématu Podporované základní modely. Informace o regionální podpoře pro každý model naleznete v tématu Regionální dostupnost pro základní modely.
Měření hodin jednotek kapacity (watsonx a Watson Machine Learning)
Spotřeba CUH je ovlivněna výpočetními hardwarovými prostředky, které použijete pro úlohu, stejně jako další faktory jako je specifikace softwaru a typ modelu.
Míra spotřeby CUH podle typu aktiva
Typ aktiva | Typ kapacity | Jednotky kapacity za hodinu |
---|---|---|
Experiment AutoAI | 8 vCPU a 32 GB RAM | 20 |
Školení Decision Optimization | 2 vCPU a 8 GB RAM 4 vCPU a 16 GB RAM 8 vCPU a 32 GB RAM 16 vCPU a 64 GB RAM |
6 7 9 13 |
Implementace Decision Optimization | 2 vCPU a 8 GB RAM 4 vCPU a 16 GB RAM 8 vCPU a 32 GB RAM 16 vCPU a 64 GB RAM |
30 40 50 60 |
Modely Machine Learning (školení, hodnocení nebo vyhodnocování) |
1 vCPU a 4 GB RAM 2 vCPU a 8 GB RAM 4 vCPU a 16 GB RAM 8 vCPU a 32 GB RAM 16 vCPU a 64 GB RAM |
0.5 1 2 4 8 |
Spotřeba CUH podle implementace a typu rámce
Spotřeba CUH pro implementace se vypočítá pomocí těchto vzorců:
Typ implementace | Rámec | Výpočet CUH |
---|---|---|
Online | AutoAI, Python funkce a skripty, SPSS, Scikit-Learn custom libraries, Tensorflow, RShiny | aktivace_aktiv_implementace * počet_uzlů * CUH_rate_for_capacity_type_framework |
Online | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_seconds * nodon_nodes * CUH_rate_for_capacity_type_framework |
Dávka | všechny rámce | job_duration_in_seconds * nodon_nodes * CUH_rate_for_capacity_type_framework |
Monitorování využití prostředků
Můžete sledovat využití CUH nebo RU pro aktiva, se kterým vlastníte, nebo spolupracujete na projektu nebo prostoru. Jste-li vlastníkem účtu nebo administrátorem, můžete sledovat využití CUH nebo RU pro celý účet.
Sledování využití CUH nebo RU v projektu
Chcete-li monitorovat spotřebu CUH nebo RU v projektu, postupujte takto:
Přejděte na kartu Spravovat pro projekt.
Klepněte na volbu Prostředky , chcete-li přezkoumat souhrn spotřeby prostředků pro aktiva v projektu nebo prostoru, nebo můžete přezkoumat podrobnosti o spotřebě prostředků pro konkrétní aktiva.
Sledování využití CUH pro účet
Můžete sledovat využití běhového prostředí pro účet na stránce Běhová prostředí , pokud jste vlastníkem účtu IBM Cloud nebo administrátorem nebo vlastníkem služby Watson Machine Learning . Podrobnosti naleznete v tématu Monitorování prostředků.
Sledování spotřeby CUH pro výuku počítače v notebooku
Chcete-li vypočítat jednotkovou jednotku kapacity v zápisníku, použijte:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
Například:
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
vrátí hodnotu 5.49 CUH
Podrobnosti viz sekce Instance služby v dokumentaci produktu Rozhraní API IBM Watson Machine Learning .
Další informace
Nadřízené téma: Watson Machine Learning