0 / 0
Zurück zur englischen Version der Dokumentation
Hierarchische Textkategorisierung
Letzte Aktualisierung: 22. Juli 2024
Hierarchische Textkategorisierung

Der Block Watson Natural Language Processing Categories weist einem Eingabedokument einzelne Knoten innerhalb einer hierarchischen Taxonomie zu. Beispiel: Im Text IBM kündigt neue Fortschritte beim Quantencomputing ansind Beispiele für extrahierte Kategorien technology and computing/hardware/computer und technology and computing/operating systems. Diese Kategorien stellen Knoten der Ebenen 3 und 2 in einer hierarchischen Taxonomie dar.

Dieser Block unterscheidet sich vom Klassifikationsblock dadurch, dass das Training mit einer Gruppe von Seedphrasen beginnt, die jedem Knoten in der Taxonomie zugeordnet sind, und keine gekennzeichneten Dokumente erfordert.

Beachten Sie, dass der hierarchische Textkategorisierungsblock nur in einem Notebook verwendet werden kann, das in einer Umgebung gestartet wird, die die Bibliothek Watson Natural Language Processing enthält.

Blockname

categories_esa_en_stock

Unterstützte Sprachen

Der Block "Kategorien" ist für die folgenden Sprachen verfügbar: Eine Liste der Sprachcodes und der entsprechenden Sprache finden Sie in Sprachcodes.

de, en

Funktionen

Mit diesem Block können Sie die Themen von Dokumenten im Web ermitteln, indem Sie Webseiten in eine Taxonomie allgemeiner Domänenthemen kategorisieren, um Werbeplatzierungen und Inhaltsempfehlungen zu erhalten. Das Modell wurde anhand von Daten aus Nachrichtenberichten und allgemeinen Webseiten getestet.

Eine Liste der Kategorien, die zurückgegeben werden können, finden Sie unter Kategorietypen.

Abhängigkeiten von anderen Blöcken

Der folgende Block muss ausgeführt werden, bevor Sie den hierarchischen Kategorisierungsblock ausführen können:

  • syntax_izumo_<language>_stock

Codebeispiel

import watson_nlp

# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')

# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)

Ausgabe des Codebeispiels:

{
  "categories": [
    {
      "labels": [
        "technology & computing",
        "computing"
      ],
      "score": 0.992489,
      "explanation": []
    },
    {
      "labels": [
        "science",
        "physics"
      ],
      "score": 0.945449,
      "explanation": []
    }
  ],
  "producer_id": {
    "name": "ESA Hierarchical Categories",
    "version": "1.0.0"
  }
}

Übergeordnetes Thema: Watson Natural Language Processing-Taskkatalog

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen