0 / 0
Retourner à la version anglaise de la documentation
Extraction et classement des mots clés
Dernière mise à jour : 07 nov. 2024
Extraction et classement des mots clés

L'extraction du mot clé Watson Natural Language Processing avec le bloc de classement extrait des phrases de nom à partir du texte d'entrée en fonction de leur pertinence.

Langues prises en charge

L'extraction de mots-clés avec classement des textes est disponible pour les langues suivantes :

ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn

Pour une liste des codes de langue et des langues correspondantes, voir Codes de langue.

Capacités

Les mots clés et le bloc de rang de texte classent les expressions de nom extraites d'un document d'entrée en fonction de leur pertinence dans le document.

Fonctions d'extraction et de classement des mots clés sur la base d'un exemple
Capacités Exemples
Les rangs ont extrait des phrases basées sur la pertinence " Anna est allée à l'université de Californie à Santa Cruz. Anna a rejoint l'université en 2015. " -> Anna, University of California Santa Cruz

Keyword Extraction

Nom de bloc

keywords_embed-rank_multi_stock

Dépendances sur d'autres blocs

Les blocs suivants doivent être exécutés avant de pouvoir exécuter l'extraction de mot clé avec le bloc de classement :

  • syntax_izumo_<language>_stock
  • noun-phrases_rbr_<language>_stock

Exemple de code

import watson_nlp
from watson_nlp import data_model as dm
text = "Anna went to school at University of California Santa Cruz. \
        Anna joined the university in 2015."

# Load Noun Phrases, Embedding and Keywords models for English
noun_phrases_model = watson_nlp.load('noun-phrases_rbr_en_stock')
use_model = watson_nlp.load('embedding_use_en_stock')
keywords_model = watson_nlp.load('keywords_embed-rank_multi_stock')

# Run the Noun Phrases model
noun_phrases = noun_phrases_model.run(text)

# Get document embeddings
# No need to run any Syntax model since the 'raw_text' embed style will be used for doc embedding
syntax_analysis = dm.SyntaxPrediction(text=text)
doc_embeddings = use_model.run(syntax_analysis, doc_embed_style='raw_text')

# Get embeddings for noun phrases
noun_phrases_analysis = [dm.SyntaxPrediction(text=c.span.text) for c in noun_phrases.noun_phrases]
noun_phrase_embeddings = use_model.run_batch(noun_phrases_analysis, doc_embed_style='raw_text')

# Run the keywords model
keywords = keywords_model.run(doc_embeddings, noun_phrases, noun_phrase_embeddings, limit=2, beta=0.5)
print(keywords)

Sortie de l'exemple de code :

{
  "keywords": [
    {
      "text": "University of California Santa Cruz",
      "relevance": 1.0,
      "mentions": [
        {
          "begin": 23,
          "end": 58,
          "text": "University of California Santa Cruz"
        }
      ],
      "count": 1
    },
    {
      "text": "Anna",
      "relevance": 0.6883336359588481,
      "mentions": [
        {
          "begin": 0,
          "end": 4,
          "text": "Anna"
        },
        {
          "begin": 68,
          "end": 72,
          "text": "Anna"
        }
      ],
      "count": 2
    }
  ],
  "producer_id": {
    "name": "Embed Rank Keywords",
    "version": "0.0.2"
  }
}

Rubrique parent: Watson Natural Language Processing

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus