L'extraction du mot clé Watson Natural Language Processing avec le bloc de classement extrait des phrases de nom à partir du texte d'entrée en fonction de leur pertinence.
Langues prises en charge
L'extraction de mots-clés avec classement des textes est disponible pour les langues suivantes :
ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn
Pour une liste des codes de langue et des langues correspondantes, voir Codes de langue.
Capacités
Les mots clés et le bloc de rang de texte classent les expressions de nom extraites d'un document d'entrée en fonction de leur pertinence dans le document.
Capacités | Exemples |
---|---|
Les rangs ont extrait des phrases basées sur la pertinence | " Anna est allée à l'université de Californie à Santa Cruz. Anna a rejoint l'université en 2015. " -> Anna, University of California Santa Cruz |
Keyword Extraction
Nom de bloc
keywords_embed-rank_multi_stock
Dépendances sur d'autres blocs
Les blocs suivants doivent être exécutés avant de pouvoir exécuter l'extraction de mot clé avec le bloc de classement :
syntax_izumo_<language>_stock
noun-phrases_rbr_<language>_stock
Exemple de code
import watson_nlp
from watson_nlp import data_model as dm
text = "Anna went to school at University of California Santa Cruz. \
Anna joined the university in 2015."
# Load Noun Phrases, Embedding and Keywords models for English
noun_phrases_model = watson_nlp.load('noun-phrases_rbr_en_stock')
use_model = watson_nlp.load('embedding_use_en_stock')
keywords_model = watson_nlp.load('keywords_embed-rank_multi_stock')
# Run the Noun Phrases model
noun_phrases = noun_phrases_model.run(text)
# Get document embeddings
# No need to run any Syntax model since the 'raw_text' embed style will be used for doc embedding
syntax_analysis = dm.SyntaxPrediction(text=text)
doc_embeddings = use_model.run(syntax_analysis, doc_embed_style='raw_text')
# Get embeddings for noun phrases
noun_phrases_analysis = [dm.SyntaxPrediction(text=c.span.text) for c in noun_phrases.noun_phrases]
noun_phrase_embeddings = use_model.run_batch(noun_phrases_analysis, doc_embed_style='raw_text')
# Run the keywords model
keywords = keywords_model.run(doc_embeddings, noun_phrases, noun_phrase_embeddings, limit=2, beta=0.5)
print(keywords)
Sortie de l'exemple de code :
{
"keywords": [
{
"text": "University of California Santa Cruz",
"relevance": 1.0,
"mentions": [
{
"begin": 23,
"end": 58,
"text": "University of California Santa Cruz"
}
],
"count": 1
},
{
"text": "Anna",
"relevance": 0.6883336359588481,
"mentions": [
{
"begin": 0,
"end": 4,
"text": "Anna"
},
{
"begin": 68,
"end": 72,
"text": "Anna"
}
],
"count": 2
}
],
"producer_id": {
"name": "Embed Rank Keywords",
"version": "0.0.2"
}
}
Rubrique parent: Watson Natural Language Processing