Translation not up to date
Produkt Watson Natural Language Processing poskytuje předškolené modely ve více než 20 jazycích. Jsou vyclány specializovaným týmem odborníků a hodnotí se kvalita na každém specifickém jazyce. Tyto předškolené modely lze používat v produkčních prostředích, aniž byste se museli starat o porušení licenčních práv nebo duševního vlastnictví.
Načtení a spuštění modelu
Chcete-li načíst model, musíte nejprve znát jeho název. Názvy modelů se řídí podle standardní konvence kódování modelu (jako je klasifikace nebo extrakce entit), typ algoritmu (jako je BERT nebo SVM), kód jazyka a podrobnosti o typového systému.
Chcete-li vyhledat model, který odpovídá vašim potřebám, použijte katalog úloh. Viz Katalog úloh Watson NLP.
You can find the expected input for a given block class (for example to the Entity Mentions model) by using help()
on the block class run()
method:
import watson_nlp
help(watson_nlp.blocks.keywords.TextRank.run)
Watson Zpracování přirozeného jazyka zapouzdřuje funkčnost přirozeného jazyka prostřednictvím bloků a sledů prací. Každý blok nebo sled prací podporuje funkce pro:
load()
: načíst modelrun()
: spuštění modelu na vstupních argumentechtrain()
: vycvičit model na vlastní data (ne všechny bloky a trénink podpory sledů prací)save()
: uložit model, který byl vycvičen ve vašich vlastních datech.
Bloky
Existují dva typy bloků:
Sledy prací spustí jeden další bloky na vstupním dokumentu, v koloně.
Bloky, které pracují přímo na vstupním dokumentu
Příkladem bloku, který pracuje přímo na vstupním dokumentu, je syntaktický blok, který provádí operace zpracování přirozeného jazyka, jako např. převod na prvky, lemmatizace, část použití značek řeči nebo syntaktická analýza závislostí.
Příklad: spuštění analýzy syntaxe na textovém úseku kódu:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Bloky závislé na jiných blocích
Bloky, které závisí na jiných blocích, nemohou být na vstupním dokumentu aplikovány přímo. Jsou aplikovány na výstup jednoho nebo více předpředcházejících bloků. Například blok Extrakce klíčového slova závisí na bloku Syntax a Noun PSSmaže.
Tyto bloky lze načíst, ale lze je spustit pouze v určitém pořadí na vstupním dokumentu. Například:
import watson_nlp
text = "Anna went to school at University of California Santa Cruz. \
Anna joined the university in 2015."
# Load Syntax, Noun Phrases and Keywords models for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
noun_phrases_model = watson_nlp.load('noun-phrases_rbr_en_stock')
keywords_model = watson_nlp.load('keywords_text-rank_en_stock')
# Run the Syntax and Noun Phrases models
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
noun_phrases = noun_phrases_model.run(text)
# Run the keywords model
keywords = keywords_model.run(syntax_prediction, noun_phrases, limit=2)
print(keywords)
Sledy prací
Sledy prací jsou předdefinované koncové kolony z prvotního dokumentu do konečného bloku, kde jsou všechny nezbytné bloky zřetězeny jako součást propojení procesů sledu prací. Například blok Mentions entity nabízený v běhovém prostředí 22.2 vyžaduje výsledky analýzy syntaxe, takže proces koncový-konec bude: vstupní text-> Analýza syntaxe-> zmínky o entitách-> Výsledky zmínky o entitách. Počínaje běhovým prostředím 23.1můžete volat sled prací Mentions entity. Prohlédněte si tuto ukázku:
import watson_nlp
# Load the workflow model
mentions_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
# Run the entity extraction workflow on the input text
mentions_workflow.run('IBM announced new advances in quantum computing', language_code="en")
Nadřízené téma: KnihovnaWatson Natural Language Processing Library