Le bloc Watson Natural Language Processing Categories affecte des noeuds individuels au sein d'une taxonomie hiérarchique à un document d'entrée. Par exemple, dans le texte IBM annonce de nouvelles avancées en informatique quantique, des exemples de catégories extraites sont technology and computing/hardware/computer
et technology and computing/operating systems
. Ces catégories représentent les noeuds de niveau 3 et de niveau 2 dans une taxonomie hiérarchique.
Ce bloc diffère du bloc Classification dans la mesure où l'apprentissage commence à partir d'un ensemble de phrases de départ associées à chaque noeud de la taxonomie et ne nécessite pas de documents libellés.
Notez que le bloc de catégorisation de texte hiérarchique ne peut être utilisé que dans un bloc-notes démarré dans un environnement qui inclut la bibliothèque Watson Natural Language Processing.
Nom de bloc
categories_esa_en_stock
Langues prises en charge
Le bloc Catégories est disponible pour les langues suivantes. Pour obtenir la liste des codes de langue et de la langue correspondante, voir Codes de langue.
de, en
Capacités
Utilisez ce bloc pour déterminer les rubriques des documents sur le Web en catégorisant les pages Web dans une taxonomie de rubriques de domaine général, pour le placement de publicité et la recommandation de contenu. Le modèle a été testé sur des données provenant de rapports d'actualités et de pages Web générales.
Pour obtenir la liste des catégories pouvant être renvoyées, voir Types de catégorie.
Dépendances sur d'autres blocs
Le bloc suivant doit être exécuté pour que vous puissiez exécuter le bloc de catégorisation hiérarchique:
syntax_izumo_<language>_stock
Exemple de code
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
Sortie de l'exemple de code :
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}
Rubrique parent: Watson Natural Language Processing