Der Block Watson Natural Language Processing Categories weist einem Eingabedokument einzelne Knoten innerhalb einer hierarchischen Taxonomie zu. Beispiel: Im Text IBM kündigt neue Fortschritte beim Quantencomputing ansind Beispiele für extrahierte Kategorien technology and computing/hardware/computer
und technology and computing/operating systems
. Diese Kategorien stellen Knoten der Ebenen 3 und 2 in einer hierarchischen Taxonomie dar.
Dieser Block unterscheidet sich vom Klassifikationsblock dadurch, dass das Training mit einer Gruppe von Seedphrasen beginnt, die jedem Knoten in der Taxonomie zugeordnet sind, und keine gekennzeichneten Dokumente erfordert.
Beachten Sie, dass der hierarchische Textkategorisierungsblock nur in einem Notebook verwendet werden kann, das in einer Umgebung gestartet wird, die die Bibliothek Watson Natural Language Processing enthält.
Blockname
categories_esa_en_stock
Unterstützte Sprachen
Der Block "Kategorien" ist für die folgenden Sprachen verfügbar: Eine Liste der Sprachcodes und der entsprechenden Sprache finden Sie in Sprachcodes.
de, en
Funktionen
Mit diesem Block können Sie die Themen von Dokumenten im Web ermitteln, indem Sie Webseiten in eine Taxonomie allgemeiner Domänenthemen kategorisieren, um Werbeplatzierungen und Inhaltsempfehlungen zu erhalten. Das Modell wurde anhand von Daten aus Nachrichtenberichten und allgemeinen Webseiten getestet.
Eine Liste der Kategorien, die zurückgegeben werden können, finden Sie unter Kategorietypen.
Abhängigkeiten von anderen Blöcken
Der folgende Block muss ausgeführt werden, bevor Sie den hierarchischen Kategorisierungsblock ausführen können:
syntax_izumo_<language>_stock
Codebeispiel
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
Ausgabe des Codebeispiels:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}
Übergeordnetes Thema: Watson Natural Language Processing-Taskkatalog