0 / 0
Go back to the English version of the documentation
Plány a výpočetní využití produktu Watson Machine Learning

Plány a výpočetní využití produktu Watson Machine Learning

Použijte prostředky produktu Watson Machine Learning , které se měří v jednotkách kapacity jednotky kapacity (CUH), když cvičíte modely AutoAI , spustíte modelové výukové modely nebo modelové implementované modely. Použijte prostředky Watson Machine Learning , měřené v jednotkách prostředků (RU), když spouštíte dedukce služeb se základními modely. Toto téma popisuje různé plány, které si můžete vybrat, jaké služby jsou zahrnuty a jak se počítají výpočetní prostředky.

Watson Machine Learning v Cloud Pak for Data as a Service a watsonx

Důležité:

Plán Watson Machine Learning obsahuje podrobnosti o souboru watsonx.ai. Watsonx.ai je studio integrovaných nástrojů pro práci s generativními AI, poháněných modelovými modely a modely strojového učení. Používáte-li produkt Cloud Pak for Data as a Service, pak se podrobnosti pro práci s modely základů a s výzvou k měření měření pomocí prostředků Resource Units na váš plán nevztahují.

Další informace o souboru watsonx.aiviz:

Pokud jste povolili pro watsonx i Cloud Pak for Data as a Service, můžete přepínat mezi těmito dvěma platformami.

Výběr plánu produktu Watson Machine Learning

Zobrazte si porovnání plánů a zvažte podrobnosti k výběru plánu, který vyhovuje vašim potřebám.

Plány produktu Watson Machine Learning

Plány produktu Watson Machine Learning řídí, jak jste vyfakturovány pro modely, které cvičíte a implementujete pomocí produktu Watson Machine Learning a pro výzvy, které používáte se modely základů. Zvolte si plán na základě svých potřeb:

  • Lite je volný plán s omezenou kapacitou. Tento plán vyberte v případě, že hodnotíte produkt Watson Machine Learning a chcete vyzkoušet schopnosti.
  • Hlavní informace je plán podpory, který vám poskytuje flexibilitu při sestavování, implementaci a správě modelů, které odpovídají vašim potřebám.
  • Standard je podnikový plán vysoké kapacity, který je navržen tak, aby podporoval všechny potřeby výuky počítačů v organizaci. Hodiny jednotkové kapacity se poskytují v paušální sazbě, zatímco spotřeba jednotky prostředků je placena-jak-vy-vy-jít.

Podrobnosti plánu a stanovení ceny najdete v tématu IBM Cloud Machine Learning.

Hodiny jednotkové kapacity (CUH), tokeny a jednotky prostředků (RU)

Pro účely měření a fakturace se měří strojové modelové modely a implementace nebo základní modely s těmito jednotkami:

  • Hodiny jednotky kapacity (CUH) měří spotřebu výpočetních prostředků za jednotku času pro účely použití a účtování. Hodnota CUH měří všechny aktivity produktu Watson Machine Learning s výjimkou základního modelu Foundation Inferencing.

  • Jednotky prostředků (RU) měří základní model spotřeby dedukcí. Inference je proces volání základního modelu za účelem generování výstupu v odpovědi na výzvu k zadání. Každý stojanová jednotka se rovná 1000 tokenů. Token je základní jednotka textu (obvykle 4 znaky nebo 0.75 slov) použitá ve vstupu nebo výstupu pro výzvu k zadání modelu základů. Zvolte plán, který odpovídá vašim požadavkům na použití. Podrobné informace o tokenech naleznete v tématu Tokeny a tokenizace.

  • Limit četnosti monitoruje a omezuje počet požadavků na odvozování za sekundu zpracovaných pro základní modely pro danou instanci plánu Watson Machine Learning . Limit sazeb je vyšší u placených plánů než u bezplatného plánu Lite.

Podrobnosti plánu produktu Watson Machine Learning

Jednoduchý plán poskytuje dostatek volných prostředků, abyste mohli vyhodnotit schopnosti watsonx.ai. Poté můžete zvolit placený plán, který odpovídá potřebám vaší organizace, a to na základě funkcí a kapacity plánu.

Tabulka 1. Podrobnosti plánu
Funkce plánu Lite Essentials Standardní
Využití Machine Learning v CUH 20 CUH měsíčně Účtování CUH založené na sazbě CUH vynásobené dobou spotřeby 2500 CUH za měsíc
Odpor modelu Foundation v tokenech nebo jednotkách prostředků (RU) 50 000 tokenů za měsíc Účtováno pro použití (1000 tokenů = 1 RU) Účtováno pro použití (1000 tokenů = 1 RU)
Maximální paralelní dávkové úlohy Decision Optimization pro každou implementaci 2 5 100
Zachované úlohy implementace za prostor 100 1000 3000
Doba implementace do nečinnosti 1 den 3 dny 3 dny
Podpora HIPAA NEDEF NEDEF Pouze oblast Dallas
Musí být povolena ve vašem účtu IBM Cloud
Omezení četnosti na ID plánu 2 požadavky na odvozování za sekundu 8 požadavků na odvozování za sekundu 8 požadavků na odvozování za sekundu

Poznámka: Pokud upgradujete z produktu Essentials na Standard, nemůžete se vrátit zpět k plánu Essentials. Musíte vytvořit nový plán.

Pro všechny plány:

  • Základní model Inferencing Resource Units (RU) lze použít pro dereferenci testovacího pracoviště výzvy k zadání, včetně vstupu a výstupu. To znamená, že výzva, kterou jste zadali pro vstup, se počítá jako dodatek k generovanému výstupu. (pouzewatsonx )
  • Inference modelového modelu je k dispozici pouze pro datová centra v Dallasu a Frankfurtu. (pouzewatsonx )
  • Rychlost RU určují tři třídy modelu. Cena za RU se liší podle třídy modelu. (pouzewatsonx )
  • Spotřeba kapacity jednotky jednotková hodina (CUH) pro školení je založena na školicím nástroji, specifikaci hardwaru a běhovém prostředí.
  • Spotřeba kapacity jednotky jednotková kapacita (CUH) pro implementaci je založena na typu implementace, specifikaci hardwaru a specifikaci softwaru.
  • Produkt Watson Machine Learning uvádí omezení počtu úloh implementace uchovaných pro jednotlivé prostory implementace. Pokud překročíte limit, nemůžete vytvořit nové úlohy implementace, dokud neodstraníte existující úlohy nebo neupgradujete svůj plán. Při výchozím nastavení budou metadata úloh automaticky odstraněna po 30 dnech. Tuto hodnotu můžete přepsat při vytváření úlohy. Viz Správa úloh.
  • Doba do nečinnosti odkazuje na dobu, po kterou se má zvážit implementace aktivní mezi požadavky na přidělení skóre. Pokud implementace neobdrží požadavky na přidělení skóre pro danou dobu trvání, je považována za neaktivní nebo nečinná a účtování se zastaví pro všechny rámce jiné než SPSS.
  • Plán umožňuje alespoň stanovený limit sazby a skutečný limit sazby může být vyšší než uvedený limit. Například plán Lite může zpracovat více než 2 požadavky za sekundu bez zadání chyby. Pokud máte placený plán a domníváte se, že jste dosáhli chybného limitu sazeb, obraťte se na podporu IBM se žádostí o pomoc.

Podrobnosti plánu a stanovení ceny najdete v tématu IBM Cloud Machine Learning.

Měření jednotek prostředků (watsonx)

Účtování jednotek prostředků je založeno na rychlosti účtovací třídy pro základní model vynásobený počtem jednotek RVU (Resource Units). Jednotka prostředku se rovná 1000 tokenům ze vstupu a výstupu z dedukcí modelu základní nabídky. Třídační třídy modelu základny mají různé sazby RU.

Model Původ Účtovací třída Cena za jednotku RU
granite-13b-instruct-v1 IBM Třída 3 $0.0050 na RU
granite-13b-chat-v1 IBM Třída 3 $0.0050 na RU
flan-t5-xxl-11b otevřený zdrojový kód Třída 2 $0.0018 na RU
flan-ul2-20b otevřený zdrojový kód Třída 3 $0.0050 na RU
gpt-neox-20b otevřený zdrojový kód Třída 3 $0.0050 na RU
llama-2-13b-chat otevřený zdrojový kód Třída 2 $0.0018 na RU
llama-2-70b-chat otevřený zdrojový kód Třída 3 $0.0050 na RU
mpt-7b-instruct2 otevřený zdrojový kód Třída 1 $0.0006 na RU
mt0-xxl-13b otevřený zdrojový kód Třída 2 $0.0018 na RU
starcoder-15.5b otevřený zdrojový kód Třída 2 $0.0018 na RU

Další informace o každém modelu najdete v tématu Podporované základní modely. Informace o regionální podpoře pro každý model naleznete v tématu Regionální dostupnost pro základní modely.

Poznámka: Když používáte aplikaci generative AI pro vyhledávání a příjem pro tuto organizační jednotku dokumentace, nespotřebováváte tokeny.

Měření hodin jednotek kapacity (watsonx a Watson Machine Learning)

Spotřeba CUH je ovlivněna výpočetními hardwarovými prostředky, které použijete pro úlohu, stejně jako další faktory jako je specifikace softwaru a typ modelu.

Míra spotřeby CUH podle typu aktiva

Tabulka 3. Míra spotřeby CUH podle typu aktiva
Typ aktiva Typ kapacity Jednotky kapacity za hodinu
Experiment AutoAI 8 vCPU a 32 GB RAM 20
Školení Decision Optimization 2 vCPU a 8 GB RAM
4 vCPU a 16 GB RAM
8 vCPU a 32 GB RAM
16 vCPU a 64 GB RAM
6
7
9
13
Implementace Decision Optimization 2 vCPU a 8 GB RAM
4 vCPU a 16 GB RAM
8 vCPU a 32 GB RAM
16 vCPU a 64 GB RAM
30
40
50
60
Modely Machine Learning
(školení, hodnocení nebo vyhodnocování)
1 vCPU a 4 GB RAM
2 vCPU a 8 GB RAM
4 vCPU a 16 GB RAM
8 vCPU a 32 GB RAM
16 vCPU a 64 GB RAM
0.5
1
2
4
8

Spotřeba CUH podle implementace a typu rámce

Spotřeba CUH pro implementace se vypočítá pomocí těchto vzorců:

Tabulka 4. Spotřeba CUH podle implementace a typu rámce
Typ implementace Rámec Výpočet CUH
Online AutoAI, Python funkce a skripty, SPSS, Scikit-Learn custom libraries, Tensorflow, RShiny aktivace_aktiv_implementace * počet_uzlů * CUH_rate_for_capacity_type_framework
Online Spark, PMML, Scikit-Learn, Pytorch, XGBoost score_duration_in_seconds * nodon_nodes * CUH_rate_for_capacity_type_framework
Dávka všechny rámce job_duration_in_seconds * nodon_nodes * CUH_rate_for_capacity_type_framework

Monitorování využití prostředků

Můžete sledovat využití CUH nebo RU pro aktiva, se kterým vlastníte, nebo spolupracujete na projektu nebo prostoru. Jste-li vlastníkem účtu nebo administrátorem, můžete sledovat využití CUH nebo RU pro celý účet.

Sledování využití CUH nebo RU v projektu

Chcete-li monitorovat spotřebu CUH nebo RU v projektu, postupujte takto:

  1. Přejděte na kartu Spravovat pro projekt.

  2. Klepněte na volbu Prostředky , chcete-li přezkoumat souhrn spotřeby prostředků pro aktiva v projektu nebo prostoru, nebo můžete přezkoumat podrobnosti o spotřebě prostředků pro konkrétní aktiva.

    Sledování prostředků v projektu

Sledování využití CUH pro účet

Můžete sledovat využití běhového prostředí pro účet na stránce Běhová prostředí , pokud jste vlastníkem účtu IBM Cloud nebo administrátorem nebo vlastníkem služby Watson Machine Learning . Podrobnosti naleznete v tématu Monitorování prostředků.

Sledování spotřeby CUH pro výuku počítače v notebooku

Chcete-li vypočítat jednotkovou jednotku kapacity v zápisníku, použijte:

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

Například:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

vrátí hodnotu 5.49 CUH

Podrobnosti viz sekce Instance služby v dokumentaci produktu Rozhraní API IBM Watson Machine Learning .

Další informace

Nadřízené téma: Watson Machine Learning

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more