Il blocco Watson Natural Language Processing Categories assegna singoli nodi all'interno di una tassonomia gerarchica a un documento di input. Ad esempio, nel testo IBM annuncia nuovi progressi nel calcolo quantistico, esempi di categorie estratte sono technology and computing/hardware/computer
e technology and computing/operating systems
. Queste categorie rappresentano nodi di livello 3 e di livello 2 in una tassonomia gerarchica.
Questo blocco differisce dal blocco Classificazione in quanto l'addestramento inizia da una serie di frasi di inizializzazione associate a ciascun nodo nella tassonomia e non richiede documenti etichettati.
Si noti che il blocco di categorizzazione del testo gerarchico può essere utilizzato solo in un notebook avviato in un ambiente che include la libreria Watson Natural Language Processing.
Nome blocco
categories_esa_en_stock
Lingue supportate
Il blocco Categorie è disponibile per le lingue seguenti. Per un elenco dei codici lingua e della lingua corrispondente, consultare Codici lingua.
de, en
Funzioni
Utilizzare questo blocco per determinare gli argomenti dei documenti sul Web categorizzando le pagine Web in una tassonomia di argomenti di dominio generale, per il posizionamento degli annunci e la raccomandazione del contenuto. Il modello è stato testato su dati provenienti da notizie e pagine web generali.
Per un elenco delle categorie che è possibile restituire, consultare Tipi di categoria.
Dipendenze da altri blocchi
Il seguente blocco deve essere eseguito prima di poter eseguire il blocco di categorizzazione gerarchica:
syntax_izumo_<language>_stock
Esempio di codice
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
Output dell'esempio di codice:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}
Argomento principale: Watson Natural Language Processing task catalog