Translation not up to date
Blok kategorii przetwarzania języka naturalnego Watson przypisuje poszczególne węzły w obrębie systematyki hierarchicznej do dokumentu wejściowego. Na przykład w tekście IBM zapowiada nowe zaliczki w przetwarzaniu kwantowym, przykłady wyodrębnionych kategorii to technology and computing/hardware/computer
i technology and computing/operating systems
. Te kategorie reprezentują węzły poziomu 3 i 2 w systematyce hierarchicznej.
Ten blok różni się od bloku klasyfikacji w tym szkoleniu rozpoczyna się od zestawu fraz początkowych powiązanych z każdym węzłem w systematyce i nie wymaga etykiet z etykietami.
Należy zauważyć, że blok kategoryzacji tekstu hierarchicznego może być używany tylko w notatniku, który jest uruchamiany w środowisku opartym na środowisku wykonawczym 22.2 lub w środowisku wykonawczym 23.1 , które zawiera bibliotekę Watson Natural Language Processing.
Nazwa bloku
categories_esa_en_stock
Obsługiwane języki
Blok Kategorie jest dostępny dla następujących języków. Listę kodów języków i odpowiedniego języka można znaleźć w sekcji Kody języków.
de, en
Możliwości
Ten blok służy do określania tematów dokumentów w sieci WWW poprzez kategoryzowanie stron WWW w systematykę ogólnych tematów dotyczących domen, w celu umieszczania reklam i rekomendowania treści. Model został przetestowany na podstawie danych z raportów informacyjnych i ogólnych stron WWW.
Listę kategorii, które mogą zostać zwrócone, zawiera sekcja Typy kategorii.
Zależności na innych blokach
Następujący blok musi zostać uruchomiony, aby można było uruchomić hierarchiczny blok kategoryzacji:
syntax_izumo_<language>_stock
Przykład kodu
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
Dane wyjściowe przykładu kodu:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}
Temat nadrzędny: Watson Katalog zadań przetwarzania języka naturalnego