Translation not up to date
Knihovna Watson Natural Language Processing poskytuje funkce zpracování přirozeného jazyka pro syntaktickou analýzu a předpřipravené modely pro širokou škálu úloh zpracování textu, jako je analýza vyznění, extrakce klíčových slov a klasifikace. Knihovna Watson Natural Language Processing je k dispozici pouze pro Python .
Pomocí Watson Natural Language Processing můžete nestrukturovaná data přeměnit na strukturovaná data, což vám usnadní pochopení a přenos dat, zejména pokud pracujete s kombinací nestrukturovaných a strukturovaných dat. Příkladem takových dat jsou záznamy call center, stížnosti zákazníků, příspěvky na sociálních sítích nebo zprávy o problémech. Nestrukturovaná data jsou často součástí většího datového záznamu, který zahrnuje sloupce se strukturovanými daty. Extrahování významu a struktury z nestrukturovaných dat a kombinace těchto informací s daty ve sloupcích strukturovaných dat vám poskytne hlubší pochopení vstupních dat a pomůže vám lépe se rozhodovat.
Watson Natural Language Processing poskytuje předem vyškolené modely ve více než 20 jazycích. Jsou kurátorem specializovaného týmu odborníků a hodnotí kvalitu každého konkrétního jazyka. Tyto předem vyškolené modely mohou být použity v produkčních prostředích, aniž byste se museli starat o porušení licence nebo duševního vlastnictví.
Ačkoli si můžete vytvořit vlastní modely, nejjednodušším způsobem, jak začít s Watson Natural Language Processing, je spustit předem natrénované modely na nestrukturovaném textu k provedení úloh zpracování jazyka.
Zde je několik příkladů úloh zpracování jazyka, které jsou k dispozici v předem natrénovaných modelech Watson Natural Language Processing:
- Detekce jazyka: zjištění jazyka vstupního textu
- Syntaxe: tokenizace, lemmatizace, značkování slovních druhů a analýza závislostí
- Extrakce entit: najít zmínky o entitách (jako je osoba, organizace nebo datum)
- Extrakce podstatné jméno fráze: extrahovat podstatné jméno fráze ze vstupního textu
- Klasifikace textu: analyzovat text a poté přiřadit sadu předdefinovaných značek nebo kategorií na základě jeho obsahu
- Klasifikace sentimentu: je vstupní dokument pozitivní, negativní nebo neutrální?
- Tón klasifikace: klasifikovat tón ve vstupním dokumentu (jako vzrušený, frustrovaný, nebo smutný)
- Klasifikace emocí: klasifikujte emoce vstupního dokumentu (jako hněv nebo znechucení)
- extrakce klíčových slov: extrahovat podstatné jméno fráze, které jsou relevantní ve vstupním textu
- Koncepty: najít koncepty z DBPedia ve vstupním textu
- Vztahy: zjištění vztahů mezi dvěma entitami
- Hierarchické kategorie: Přiřazení jednotlivých uzlů v rámci hierarchické taxonomie ke vstupnímu dokumentu
- Zapouzdření: namapujte jednotlivá slova nebo větší úseky textu do vektorového prostoru
Watson Natural Language Processing zapouzdřuje funkčnost přirozeného jazyka prostřednictvím bloků a sledů prací. Bloky a sledy prací podporují funkce pro načítání, spouštění, trénování a ukládání modelu.
Další informace viz Práce s předem natrénovanými modely.
Zde je několik příkladů, jak můžete použít knihovnu Watson Natural Language Processing:
Spuštění syntaktické analýzy na úseku textu:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Extrahování entit z úseku textu:
import watson_nlp
entities_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
entities = entities_workflow.run('IBM\'s CEO Arvind Krishna is based in the US', language_code="en")
print(entities.get_mention_pairs())
Příklady použití knihovny Watson Natural Language Processing naleznete v části Watson Ukázková použití knihovny zpracování přirozeného jazyka.
Použití Watson zpracování přirozeného jazyka v zápisníku
Zápisníky Python , které používají knihovnu Watson Natural Language Processing Library, můžete spustit v libovolném zde uvedeném prostředí. Šablony prostředí GPU zahrnují knihovnu Watson Natural Language Processing.
DO + NLP: Označuje, že šablony prostředí zahrnují jak knihovny CPLEX, tak knihovny DOcplex pro modelování a řešení problémů s optimalizací rozhodnutí a knihovnu Watson Natural Language Processing.
~ : Označuje, že šablona prostředí vyžaduje profesionální plán Watson Studio . Viz Plány nabídky.
Název | Konfigurace hardwaru | Rychlost v CUH za hodinu |
---|---|---|
Běhové prostředí NLP 23.1 v systému Python 3.10 XS | 2vCPU a 8 GB RAM | 6 |
DO + NLP Runtime 22.2 na Python 3.10 XS | 2 vCPU a 8 GB RAM | 6 |
GPU V100 běhový modul 23.1 v systému Python 3.10 ~ | 40 vCPU + 172 GB + 1 NVIDIA ® V100 (1 GPU) | 68 |
GPU 2xV100 běhový modul 23.1 v systému Python 3.10 ~ | 80 vCPU + 344 GB + 2 NVIDIA ® V100 (2 GPU) | 136 |
GPU V100 běhový modul 22.2 v systému Python 3.10 ~ | 40 vCPU + 172 GB + 1 NVIDIA ® V100 (1 GPU) | 68 |
GPU 2xV100 běhový modul 22.2 v systému Python 3.10 ~ | 80 vCPU + 344 GB + 2 NVIDIA ® V100 (2 GPU) | 136 |
Obvykle tato prostředí postačují ke spouštění notebooků, které používají předem sestavené modely. Pokud potřebujete větší prostředí, například pro trénování vlastních modelů, můžete vytvořit vlastní šablonu, která bude obsahovat knihovnu Watson Natural Language Processing. Viz Vytvoření vlastní šablony prostředí.
- Vytvořte vlastní šablonu bez GPU výběrem typu stroje
Default
, potřebné velikosti konfigurace hardwaru a výběremNLP Runtime 23.1 on Python 3.10
neboDO + NLP Runtime 22.2 on Python 3.10
jako verze softwaru. - Vytvořte vlastní šablonu s GPU tak, že vyberete typ stroje
GPU
, velikost konfigurace hardwaru, kterou potřebujete, a vybereteGPU Runtime 23.1 on Python 3.10
neboGPU Runtime 22.2 on Python 3.10
jako verzi softwaru.
Další informace
Nadřízené téma: Zápisníky a skripty