Die Watson Natural Language Processing-Bibliothek stellt Funktionen für die Verarbeitung natürlicher Sprache für die Syntaxanalyse und für vorab trainierte Modelle für eine Vielzahl von Textverarbeitungstasks wie Stimmungsanalyse, Schlüsselwortextraktion und Klassifikation bereit. Die Watson Natural Language Processing-Bibliothek ist nur für Python verfügbar.
Mit Watson Natural Language Processing können Sie unstrukturierte Daten in strukturierte Daten umwandeln, die leichter zu verstehen und übertragbar sind (insbesondere, wenn Sie mit einer Mischung aus unstrukturierten und strukturierten Daten arbeiten). Beispiele für solche Daten sind Call-Center-Datensätze, Kundenbeschwerden, Beiträge in sozialen Medien oder Problemberichte. Die unstrukturierten Daten sind häufig Teil eines größeren Datensatzes, der Spalten mit strukturierten Daten enthält. Extrahieren von Bedeutung und Struktur aus den unstrukturierten Daten und Kombinieren dieser Informationen mit den Daten in den Spalten strukturierter Daten:
- Gibt Ihnen ein tieferes Verständnis der Eingabedaten
- Kann Ihnen helfen, bessere Entscheidungen zu treffen.
Watson Natural Language Processing stellt vorab trainierte Modelle in über 20 Sprachen zur Verfügung. Sie werden von einem Team engagierter Fachleute kuratiert und in jeder unterstützten Sprache auf Qualität geprüft. Diese vorab trainierten Modelle können in Produktionsumgebungen ohne Bedenken im Hinblick auf Verstöße gegen Lizenzen oder geistiges Eigentum genutzt werden.
Obwohl Sie eigenen Modelle erstellen können, ist die einfachste Möglichkeit zum Einstieg in Watson Natural Language Processing das Anwenden der vorab trainierten Modelle auf unstrukturierten Text, um Tasks für die Sprachverarbeitung auszuführen.
Im Folgenden finden Sie einige Beispiele für Sprachverarbeitungstasks, die in Watson Natural Language Processing-vortrainierten Modellen verfügbar sind:
- Spracherkennung: Erkennung der Sprache des Eingabetextes
- Syntax: Tokenzerlegung, Reduktion auf Grundform, Wortarttagging und Abhängigkeitsanalyse
- Entitätsextraktion: Erwähnungen von Entitäten suchen (z. B. Person, Organisation oder Datum)
- Extraktion von Nomen-Phrasen: Nomen-Phrasen aus Eingabetext extrahieren
- Textklassifizierung: Text analysieren und auf der Basis des Inhalts eine Reihe vordefinierter Tags oder Kategorien zuweisen
- Stimmungsklassifizierung: Ist das Eingabedokument positiv, negativ oder neutral?
- Tonklassifizierung: Den Ton des Eingabedokuments klassifizieren (z. B. aufgeregt, frustriert oder traurig)
- Emotionsklassifizierung: Die Emotionen im Eingabedokument klassifizieren (z. B. Wut oder Abscheu)
- Schlüsselwortextraktion: Relevante Nominalphrasen aus dem Eingabetext extrahieren
- Konzepte: Konzepte aus DBPedia im Eingabetext suchen
- Beziehungen: Beziehungen zwischen zwei Einheiten erkennen
- Hierarchische Kategorien: Zuweisen einzelner Knoten innerhalb einer hierarchischen Taxonomie zum Eingabedokument
- Einbettungen: Einzelne Wörter oder größere Textausschnitte einem Vektorraum zuordnen
Watson Natural Language Processing umfasst Funktionen für natürliche Sprache durch Blöcke und Workflows. Blöcke und Workflows unterstützen Funktionen zum Laden, Ausführen, Trainieren und Speichern eines Modells.
Weitere Informationen finden Sie unter Mit vorab trainierten Modellen arbeiten.
Es folgen einige Beispiele für die Verwendung der Bibliothek Watson Natural Language Processing:
Ausführen der Syntaxanalyse für ein Textsnippet:
import watson_nlp
# Load the syntax model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Run the syntax model and print the result
syntax_prediction = syntax_model.run('Welcome to IBM!')
print(syntax_prediction)
Entitäten aus einem Textausschnitt extrahieren:
import watson_nlp
entities_workflow = watson_nlp.load('entity-mentions_transformer-workflow_multilingual_slate.153m.distilled')
entities = entities_workflow.run('IBM\'s CEO Arvind Krishna is based in the US', language_code="en")
print(entities.get_mention_pairs())
Beispiele für die Verwendung der Watson Natural Language Processing-Bibliothek finden Sie unter Watson Natural Language Processing-Bibliotheksnutzungsbeispiele.
Watson Natural Language Processing in einem Notebook verwenden
Sie können Ihre Python -Notebooks, die die Bibliothek Watson Natural Language Processing verwenden, in jeder der hier aufgelisteten Umgebungen ausführen. Die GPU-Umgebungsvorlagen enthalten die Watson Natural Language Processing-Bibliothek.
DO + NLP: Gibt an, dass die Umgebungsvorlage sowohl die CPLEX-als auch die DOcplex-Bibliotheken enthält, um Probleme bei der Entscheidungsoptimierung und die Watson Natural Language Processing-Bibliothek zu modellieren und zu lösen.
~: Zeigt an, dass die Umgebungsvorlage den watsonx.ai Studio Professional-Plan erfordert. Siehe Angebotspläne.
Ihren Namen | Hardwarekonfiguration | CUH-Rate pro Stunde |
---|---|---|
NLP + DO Laufzeit 24.1 auf Python 3.11 XS | 2vCPU und 8 GB RAM | 6 |
GPU V100 Laufzeit 24.1 auf Python 3.11 ~ | 40 vCPU + 172 GB + 1 NVIDIA ® V100 (1 GPU) | 68 |
GPU 2xV100 Laufzeit 24.1 auf Python 3.11 ~ | 80 vCPU + 344 GB + 2 NVIDIA ® V100 (2 GPUs) | 136 |
Normalerweise sind diese Umgebungen ausreichend, um Notebooks auszuführen, die vordefinierte Modelle verwenden. Wenn Sie eine größere Umgebung benötigen, zum Beispiel um Ihre eigenen Modelle zu trainieren, können Sie eine benutzerdefinierte Vorlage erstellen, die die Watson Natural Language Processing-Bibliothek enthält.
- Erstellen Sie eine angepasste Vorlage ohne GPU, indem Sie den Enginetyp
Default
, die benötigte Größe der Hardwarekonfiguration undNLP + DO Runtime 24.1 on Python 3.11
als Softwareversion auswählen. - Erstellen Sie eine angepasste Vorlage mit GPU, indem Sie den Enginetyp
GPU
, die benötigte Größe der Hardwarekonfiguration undGPU Runtime 24.1 on Python 3.11
als Softwareversion auswählen.
Weitere Informationen
- Eigene Umgebungsvorlage erstellen
- Einsatz von Natural Language Processing Modellen in watsonx.ai Runtime
Übergeordnetes Thema: Notebooks und Scripts