0 / 0
Go back to the English version of the documentation
Hierarchiczna klasyfikowanie tekstu
Last updated: 06 lip 2023
Hierarchiczna klasyfikowanie tekstu

Blok kategorii przetwarzania języka naturalnego Watson przypisuje poszczególne węzły w obrębie systematyki hierarchicznej do dokumentu wejściowego. Na przykład w tekście IBM zapowiada nowe zaliczki w przetwarzaniu kwantowym, przykłady wyodrębnionych kategorii to technology and computing/hardware/computer i technology and computing/operating systems. Te kategorie reprezentują węzły poziomu 3 i 2 w systematyce hierarchicznej.

Ten blok różni się od bloku klasyfikacji w tym szkoleniu rozpoczyna się od zestawu fraz początkowych powiązanych z każdym węzłem w systematyce i nie wymaga etykiet z etykietami.

Należy zauważyć, że blok kategoryzacji tekstu hierarchicznego może być używany tylko w notatniku, który jest uruchamiany w środowisku opartym na środowisku wykonawczym 22.2 lub w środowisku wykonawczym 23.1 , które zawiera bibliotekę Watson Natural Language Processing.

Nazwa bloku

categories_esa_en_stock

Obsługiwane języki

Blok Kategorie jest dostępny dla następujących języków. Listę kodów języków i odpowiedniego języka można znaleźć w sekcji Kody języków.

de, en

Możliwości

Ten blok służy do określania tematów dokumentów w sieci WWW poprzez kategoryzowanie stron WWW w systematykę ogólnych tematów dotyczących domen, w celu umieszczania reklam i rekomendowania treści. Model został przetestowany na podstawie danych z raportów informacyjnych i ogólnych stron WWW.

Listę kategorii, które mogą zostać zwrócone, zawiera sekcja Typy kategorii.

Zależności na innych blokach

Następujący blok musi zostać uruchomiony, aby można było uruchomić hierarchiczny blok kategoryzacji:

  • syntax_izumo_<language>_stock

Przykład kodu

import watson_nlp

# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')

# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)

Dane wyjściowe przykładu kodu:

{
  "categories": [
    {
      "labels": [
        "technology & computing",
        "computing"
      ],
      "score": 0.992489,
      "explanation": []
    },
    {
      "labels": [
        "science",
        "physics"
      ],
      "score": 0.945449,
      "explanation": []
    }
  ],
  "producer_id": {
    "name": "ESA Hierarchical Categories",
    "version": "1.0.0"
  }
}

Temat nadrzędny: Watson Katalog zadań przetwarzania języka naturalnego

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more