Translation not up to date
The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.
Last updated: 07. 11. 2023
Chcete-li určit, které modely by mohly pro váš projekt dobře fungovat, zvažte atributy modelu, jako např. licenci, data předběžného trénování, velikost modelu a způsob, jak byl model vyladěn. Poté, co máte krátký seznam modelů, které nejlépe vyhovují vašemu případu použití, systematicky otestujte modely, abyste zjistili, které z nich konzistentně vracejí výsledky, které chcete.
Atribut modelu | Podmínky |
---|---|
Délka kontextu | Někdy se nazývá délka okna kontextu, okno kontextunebo maximální délka posloupnosti, délka kontextu je maximální povolená hodnota pro počet tokenů ve vstupní výzvě k zadání plus počet tokenů v generovaném výstupu. Když generujete výstup s modely v souboru watsonx.ai, počet tokenů v generovaném výstupu je omezen parametrem Max tokenů. U některých modelů je délka tokenu výstupu modelu pro plány Lite omezena dynamickým horním limitem, specifickým pro model, řízeným prostředím. |
Náklady | Náklady na použití základových modelů se měří v jednotkách prostředků. Cena jednotky prostředku je založena na sazbě účtovací třídy pro základní model. |
Jemné doladění | Po předběžném trénování je mnoho základních modelů vyladěno pro specifické úlohy, jako je klasifikace, extrakce informací, sumarizace, odpovídání na pokyny, odpovídání na otázky nebo účast v dialogových chatech typu back-and-forth. Model, který byl vyladěn na úlohách podobných vašemu plánovanému použití, se obvykle provádí lépe s nulovými výzvami k zadání, než modely, které nebyly vyladěny způsobem, který vyhovuje vašemu případu použití. Jedním ze způsobů, jak zlepšit výsledky pro vyladěný model, je strukturovat výzvu k zadání ve stejném formátu jako výzvy k zadání v datových sadách, které byly použity k vyladění tohoto modelu. |
Pokyn-vyladěno | Pokyn-vyladěno znamená, že model byl vyladěn s výzvami, které obsahují instrukce. Když je model vyladěn instrukcemi, obvykle dobře reaguje na výzvy, které mají instrukci, i když tyto výzvy nemají příklady. |
Odškodnění za IP | Kromě licenčních podmínek přezkoumejte zásady odškodnění duševního vlastnictví pro model. Někteří poskytovatelé modelů nadace vyžadují, abyste je osvobodili od odpovědnosti za jakékoli porušení IP, které by mohlo vyplynout z použití jejich modelů AI. Chcete-li získat informace o smluvní ochraně související s IBM watsonx.ai, prohlédněte si IBM watsonx.ai popis služby. |
Licence | Obecně platí, že každý základní model je dodáván s jinou licencí, která omezuje způsob použití modelu. Přezkoumejte licence modelu, abyste se ujistili, že můžete použít model pro plánované řešení. |
Architektura modelu | Architektura modelu ovlivňuje chování modelu. Model založený na transformátoru má obvykle jednu z následujících architektur: Pouze enkodér: Porozumí vstupnímu textu na úrovni věty tím, že transformuje vstupní posloupnosti do reprezentačních vektorů nazývaných vkládání. Běžné úlohy pro modely pouze s kódováním zahrnují klasifikaci a extrakci entit. Pouze dekodér: Generuje výstupní text po slovech odvozením ze vstupní posloupnosti. Mezi běžné úlohy pro modely pouze pro dekodéry patří generování textu a odpovídání na otázky. Encoder-dekodér: Oba rozumí vstupnímu textu a generuje výstupní text na základě vstupního textu. Mezi běžné úlohy pro modely dekodérů patří překlad a sumarizace. |
Regionální dostupnost | Můžete pracovat s modely, které jsou k dispozici ve stejném regionálním datovém středisku IBM Cloud jako vaše služby watsonx . |
Podporované přírodní jazyky | Mnoho základových modelů funguje dobře pouze v angličtině. Ale někteří tvůrci modelů zahrnují více jazyků v datových sadách předběžného trénování, aby vyladili svůj model na úlohách v různých jazycích a otestovali výkon svého modelu ve více jazycích. Pokud plánujete vytvořit řešení pro globální cílovou skupinu nebo řešení, které provádí úlohy překladu, podívejte se na modely, které byly vytvořeny s ohledem na vícejazyčnou podporu. |
Podporované programovací jazyky | Ne všechny základní modely fungují dobře pro programování případů použití. Pokud plánujete vytvořit řešení, které sumarizuje, převádí, generuje nebo jinak zpracovává kód, přezkoumejte, které programovací jazyky byly zahrnuty do datových sad předběžného trénování modelu a aktivit jemného vyladění, abyste určili, zda je tento model vhodný pro váš případ použití. |
Další informace
- Tokeny a tokenizace
- Parametry modelu pro výzvu k zadání
- Rady k výzvě k zadání
- Watson Machine Learning
- Regionální dostupnost pro modely nadace
Nadřízené téma: Podporované základní modely