0 / 0
Zurück zur englischen Version der Dokumentation
Schlüsselwortextraktion und Rangfolge
Letzte Aktualisierung: 07. Nov. 2024
Schlüsselwortextraktion und Rangfolge

Der Watson Natural Language Processing-Block für Schlüsselwortextraktion mit Rangfolge extrahiert Nominalphrase aus dem Eingabetext gemäß ihrer Relevanz.

Unterstützte Sprachen

Die Schlagwortextraktion mit Text-Ranking ist für die folgenden Sprachen verfügbar:

ar, cs, da, de, en, es, fi, fr, he, hi, it, ja, ko, nb, nl, nn, pt, ro, ru, sk, sv, tr, zh-cn

Eine Liste der Sprachcodes und der entsprechenden Sprachen finden Sie unter Sprachcodes.

Fähigkeiten

Der Block für Schlüsselwörter mit Textrangfolge ordnet Nominalphrasen, die aus einem Eingabedokument extrahiert wurden, nach ihrer Relevanz innerhalb des Dokuments sind.

Funktionen der Schlüsselwortextraktion und -rangfolge auf der Basis eines Beispiels
Fähigkeiten Beispiele
Extrahierte Nominalphrasen nach Relevanz ordnen "Anna hat an der University of California Santa Cruz studiert. Anna ging im Jahr 2015 an die Universität." -> Anna, University of California Santa Cruz

Schlüsselwortextraktion

Blockname

keywords_embed-rank_multi_stock

Abhängigkeiten von anderen Blöcken

Die folgenden Blöcke müssen ausgeführt werden, bevor Sie den Block für Schlüsselwortextraktion mit Rangfolge ausführen können:

  • syntax_izumo_<language>_stock
  • noun-phrases_rbr_<language>_stock

Codebeispiel

import watson_nlp
from watson_nlp import data_model as dm
text = "Anna went to school at University of California Santa Cruz. \
        Anna joined the university in 2015."

# Load Noun Phrases, Embedding and Keywords models for English
noun_phrases_model = watson_nlp.load('noun-phrases_rbr_en_stock')
use_model = watson_nlp.load('embedding_use_en_stock')
keywords_model = watson_nlp.load('keywords_embed-rank_multi_stock')

# Run the Noun Phrases model
noun_phrases = noun_phrases_model.run(text)

# Get document embeddings
# No need to run any Syntax model since the 'raw_text' embed style will be used for doc embedding
syntax_analysis = dm.SyntaxPrediction(text=text)
doc_embeddings = use_model.run(syntax_analysis, doc_embed_style='raw_text')

# Get embeddings for noun phrases
noun_phrases_analysis = [dm.SyntaxPrediction(text=c.span.text) for c in noun_phrases.noun_phrases]
noun_phrase_embeddings = use_model.run_batch(noun_phrases_analysis, doc_embed_style='raw_text')

# Run the keywords model
keywords = keywords_model.run(doc_embeddings, noun_phrases, noun_phrase_embeddings, limit=2, beta=0.5)
print(keywords)

Ausgabe des Codebeispiels:

{
  "keywords": [
    {
      "text": "University of California Santa Cruz",
      "relevance": 1.0,
      "mentions": [
        {
          "begin": 23,
          "end": 58,
          "text": "University of California Santa Cruz"
        }
      ],
      "count": 1
    },
    {
      "text": "Anna",
      "relevance": 0.6883336359588481,
      "mentions": [
        {
          "begin": 0,
          "end": 4,
          "text": "Anna"
        },
        {
          "begin": 68,
          "end": 72,
          "text": "Anna"
        }
      ],
      "count": 2
    }
  ],
  "producer_id": {
    "name": "Embed Rank Keywords",
    "version": "0.0.2"
  }
}

Übergeordnetes Thema: Watson Natural Language Processing-Taskkatalog

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen