0 / 0
Retourner à la version anglaise de la documentation
Catégorisation de texte hiérarchique
Dernière mise à jour : 29 juil. 2024
Catégorisation de texte hiérarchique

Le bloc Watson Natural Language Processing Categories affecte des noeuds individuels au sein d'une taxonomie hiérarchique à un document d'entrée. Par exemple, dans le texte IBM annonce de nouvelles avancées en informatique quantique, des exemples de catégories extraites sont technology and computing/hardware/computer et technology and computing/operating systems. Ces catégories représentent les noeuds de niveau 3 et de niveau 2 dans une taxonomie hiérarchique.

Ce bloc diffère du bloc Classification dans la mesure où l'apprentissage commence à partir d'un ensemble de phrases de départ associées à chaque noeud de la taxonomie et ne nécessite pas de documents libellés.

Notez que le bloc de catégorisation de texte hiérarchique ne peut être utilisé que dans un bloc-notes démarré dans un environnement qui inclut la bibliothèque Watson Natural Language Processing.

Nom de bloc

categories_esa_en_stock

Langues prises en charge

Le bloc Catégories est disponible pour les langues suivantes. Pour obtenir la liste des codes de langue et de la langue correspondante, voir Codes de langue.

de, en

Capacités

Utilisez ce bloc pour déterminer les rubriques des documents sur le Web en catégorisant les pages Web dans une taxonomie de rubriques de domaine général, pour le placement de publicité et la recommandation de contenu. Le modèle a été testé sur des données provenant de rapports d'actualités et de pages Web générales.

Pour obtenir la liste des catégories pouvant être renvoyées, voir Types de catégorie.

Dépendances sur d'autres blocs

Le bloc suivant doit être exécuté pour que vous puissiez exécuter le bloc de catégorisation hiérarchique:

  • syntax_izumo_<language>_stock

Exemple de code

import watson_nlp

# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')

# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)

Sortie de l'exemple de code :

{
  "categories": [
    {
      "labels": [
        "technology & computing",
        "computing"
      ],
      "score": 0.992489,
      "explanation": []
    },
    {
      "labels": [
        "science",
        "physics"
      ],
      "score": 0.945449,
      "explanation": []
    }
  ],
  "producer_id": {
    "name": "ESA Hierarchical Categories",
    "version": "1.0.0"
  }
}

Rubrique parent: Watson Natural Language Processing

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus