Die Watson Natural Language Processing-Bibliothek stellt Funktionen für die Verarbeitung natürlicher Sprache für die Syntaxanalyse und für vorab trainierte Modelle für eine Vielzahl von Textverarbeitungstasks wie Stimmungsanalyse, Schlüsselwortextraktion und Klassifikation bereit. Die Watson Natural Language Processing-Bibliothek ist nur für Python verfügbar.
Mit Watson Natural Language Processing können Sie unstrukturierte Daten in strukturierte Daten umwandeln, die leichter zu verstehen und übertragbar sind (insbesondere, wenn Sie mit einer Mischung aus unstrukturierten und strukturierten Daten arbeiten). Beispiele für solche Daten sind Call-Center-Datensätze, Kundenbeschwerden, Beiträge in sozialen Medien oder Problemberichte. Die unstrukturierten Daten sind häufig Teil eines größeren Datensatzes, der Spalten mit strukturierten Daten enthält. Extrahieren von Bedeutung und Struktur aus den unstrukturierten Daten und Kombinieren dieser Informationen mit den Daten in den Spalten strukturierter Daten:
Gibt Ihnen ein tieferes Verständnis der Eingabedaten
Kann Ihnen helfen, bessere Entscheidungen zu treffen.
Watson Natural Language Processing stellt vorab trainierte Modelle in über 20 Sprachen zur Verfügung. Sie werden von einem Team engagierter Fachleute kuratiert und in jeder unterstützten Sprache auf Qualität geprüft. Diese vorab trainierten Modelle können in Produktionsumgebungen ohne Bedenken im Hinblick auf Verstöße gegen Lizenzen oder geistiges Eigentum genutzt werden.
Obwohl Sie eigenen Modelle erstellen können, ist die einfachste Möglichkeit zum Einstieg in Watson Natural Language Processing das Anwenden der vorab trainierten Modelle auf unstrukturierten Text, um Tasks für die Sprachverarbeitung auszuführen.
Im Folgenden finden Sie einige Beispiele für Sprachverarbeitungstasks, die in Watson Natural Language Processing-vortrainierten Modellen verfügbar sind:
Spracherkennung: Erkennung der Sprache des Eingabetextes
Syntax: Tokenzerlegung, Reduktion auf Grundform, Wortarttagging und Abhängigkeitsanalyse
Entitätsextraktion: Erwähnungen von Entitäten suchen (z. B. Person, Organisation oder Datum)
Extraktion von Nomen-Phrasen: Nomen-Phrasen aus Eingabetext extrahieren
Textklassifizierung: Text analysieren und auf der Basis des Inhalts eine Reihe vordefinierter Tags oder Kategorien zuweisen
Stimmungsklassifizierung: Ist das Eingabedokument positiv, negativ oder neutral?
Tonklassifizierung: Den Ton des Eingabedokuments klassifizieren (z. B. aufgeregt, frustriert oder traurig)
Emotionsklassifizierung: Die Emotionen im Eingabedokument klassifizieren (z. B. Wut oder Abscheu)
Schlüsselwortextraktion: Relevante Nominalphrasen aus dem Eingabetext extrahieren
Konzepte: Konzepte aus DBPedia im Eingabetext suchen
Beziehungen: Beziehungen zwischen zwei Einheiten erkennen
Hierarchische Kategorien: Zuweisen einzelner Knoten innerhalb einer hierarchischen Taxonomie zum Eingabedokument
Einbettungen: Einzelne Wörter oder größere Textausschnitte einem Vektorraum zuordnen
Watson Natural Language Processing umfasst Funktionen für natürliche Sprache durch Blöcke und Workflows. Blöcke und Workflows unterstützen Funktionen zum Laden, Ausführen, Trainieren und Speichern eines Modells.
Es folgen einige Beispiele für die Verwendung der Bibliothek Watson Natural Language Processing:
Ausführen der Syntaxanalyse für ein Textsnippet:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Copy to clipboardIn die Zwischenablage kopiert
Entitäten aus einem Textausschnitt extrahieren:
import watson_nlp
entities_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
entities = entities_workflow.run('IBM\'s CEO Arvind Krishna is based in the US', language_code="en")
print(entities.get_mention_pairs())
Watson Natural Language Processing in einem Notebook verwenden
Copy link to section
Sie können Ihre Python -Notebooks, die die Bibliothek Watson Natural Language Processing verwenden, in jeder der hier aufgelisteten Umgebungen ausführen. Die GPU-Umgebungsvorlagen enthalten die Watson Natural Language Processing-Bibliothek.
DO + NLP: Gibt an, dass die Umgebungsvorlage sowohl die CPLEX-als auch die DOcplex-Bibliotheken enthält, um Probleme bei der Entscheidungsoptimierung und die Watson Natural Language Processing-Bibliothek zu modellieren und zu lösen.
~: Zeigt an, dass die Umgebungsvorlage den watsonx.ai Studio Professional-Plan erfordert. Siehe Angebotspläne.
Umgebungsvorlagen, die die Watson Natural Language Processing-Bibliothek enthalten
Ihren Namen
Hardwarekonfiguration
CUH-Rate pro Stunde
NLP + DO Laufzeit 24.1 auf Python 3.11 XS
2vCPU und 8 GB RAM
6
GPU V100 Laufzeit 24.1 auf Python 3.11 ~
40 vCPU + 172 GB + 1 NVIDIA ® V100 (1 GPU)
68
GPU 2xV100 Laufzeit 24.1 auf Python 3.11 ~
80 vCPU + 344 GB + 2 NVIDIA ® V100 (2 GPUs)
136
Normalerweise sind diese Umgebungen ausreichend, um Notebooks auszuführen, die vordefinierte Modelle verwenden. Wenn Sie eine größere Umgebung benötigen, zum Beispiel um Ihre eigenen Modelle zu trainieren, können Sie eine benutzerdefinierte Vorlage erstellen, die die Watson Natural Language Processing-Bibliothek enthält.
Erstellen Sie eine angepasste Vorlage ohne GPU, indem Sie den Enginetyp Default, die benötigte Größe der Hardwarekonfiguration und NLP + DO Runtime 24.1 on Python 3.11 als Softwareversion auswählen.
Erstellen Sie eine angepasste Vorlage mit GPU, indem Sie den Enginetyp GPU, die benötigte Größe der Hardwarekonfiguration und GPU Runtime 24.1 on Python 3.11 als Softwareversion auswählen.