0 / 0
Go back to the English version of the documentation
Výběr modelu nadace v watsonx.ai
Last updated: 07. 11. 2023
Výběr modelu nadace v watsonx.ai

Chcete-li určit, které modely by mohly pro váš projekt dobře fungovat, zvažte atributy modelu, jako např. licenci, data předběžného trénování, velikost modelu a způsob, jak byl model vyladěn. Poté, co máte krátký seznam modelů, které nejlépe vyhovují vašemu případu použití, systematicky otestujte modely, abyste zjistili, které z nich konzistentně vracejí výsledky, které chcete.

 

Tabulka 1. Aspekty výběru základního modelu v produktu IBM watsonx.ai
Atribut modelu Podmínky
Délka kontextu Někdy se nazývá délka okna kontextu, okno kontextunebo maximální délka posloupnosti, délka kontextu je maximální povolená hodnota pro počet tokenů ve vstupní výzvě k zadání plus počet tokenů v generovaném výstupu. Když generujete výstup s modely v souboru watsonx.ai, počet tokenů v generovaném výstupu je omezen parametrem Max tokenů. U některých modelů je délka tokenu výstupu modelu pro plány Lite omezena dynamickým horním limitem, specifickým pro model, řízeným prostředím.
Náklady Náklady na použití základových modelů se měří v jednotkách prostředků. Cena jednotky prostředku je založena na sazbě účtovací třídy pro základní model.
Jemné doladění Po předběžném trénování je mnoho základních modelů vyladěno pro specifické úlohy, jako je klasifikace, extrakce informací, sumarizace, odpovídání na pokyny, odpovídání na otázky nebo účast v dialogových chatech typu back-and-forth. Model, který byl vyladěn na úlohách podobných vašemu plánovanému použití, se obvykle provádí lépe s nulovými výzvami k zadání, než modely, které nebyly vyladěny způsobem, který vyhovuje vašemu případu použití. Jedním ze způsobů, jak zlepšit výsledky pro vyladěný model, je strukturovat výzvu k zadání ve stejném formátu jako výzvy k zadání v datových sadách, které byly použity k vyladění tohoto modelu.
Pokyn-vyladěno Pokyn-vyladěno znamená, že model byl vyladěn s výzvami, které obsahují instrukce. Když je model vyladěn instrukcemi, obvykle dobře reaguje na výzvy, které mají instrukci, i když tyto výzvy nemají příklady.
Odškodnění za IP Kromě licenčních podmínek přezkoumejte zásady odškodnění duševního vlastnictví pro model. Někteří poskytovatelé modelů nadace vyžadují, abyste je osvobodili od odpovědnosti za jakékoli porušení IP, které by mohlo vyplynout z použití jejich modelů AI. Chcete-li získat informace o smluvní ochraně související s IBM watsonx.ai, prohlédněte si IBM watsonx.ai popis služby.
Licence Obecně platí, že každý základní model je dodáván s jinou licencí, která omezuje způsob použití modelu. Přezkoumejte licence modelu, abyste se ujistili, že můžete použít model pro plánované řešení.
Architektura modelu Architektura modelu ovlivňuje chování modelu. Model založený na transformátoru má obvykle jednu z následujících architektur:
Pouze enkodér: Porozumí vstupnímu textu na úrovni věty tím, že transformuje vstupní posloupnosti do reprezentačních vektorů nazývaných vkládání. Běžné úlohy pro modely pouze s kódováním zahrnují klasifikaci a extrakci entit.
Pouze dekodér: Generuje výstupní text po slovech odvozením ze vstupní posloupnosti. Mezi běžné úlohy pro modely pouze pro dekodéry patří generování textu a odpovídání na otázky.
Encoder-dekodér: Oba rozumí vstupnímu textu a generuje výstupní text na základě vstupního textu. Mezi běžné úlohy pro modely dekodérů patří překlad a sumarizace.
Regionální dostupnost Můžete pracovat s modely, které jsou k dispozici ve stejném regionálním datovém středisku IBM Cloud jako vaše služby watsonx .
Podporované přírodní jazyky Mnoho základových modelů funguje dobře pouze v angličtině. Ale někteří tvůrci modelů zahrnují více jazyků v datových sadách předběžného trénování, aby vyladili svůj model na úlohách v různých jazycích a otestovali výkon svého modelu ve více jazycích. Pokud plánujete vytvořit řešení pro globální cílovou skupinu nebo řešení, které provádí úlohy překladu, podívejte se na modely, které byly vytvořeny s ohledem na vícejazyčnou podporu.
Podporované programovací jazyky Ne všechny základní modely fungují dobře pro programování případů použití. Pokud plánujete vytvořit řešení, které sumarizuje, převádí, generuje nebo jinak zpracovává kód, přezkoumejte, které programovací jazyky byly zahrnuty do datových sad předběžného trénování modelu a aktivit jemného vyladění, abyste určili, zda je tento model vhodný pro váš případ použití.

Další informace

Nadřízené téma: Podporované základní modely

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more