0 / 0
Go back to the English version of the documentation
Syntaktická analýza
Last updated: 30. 10. 2023
Syntaktická analýza

Blok Watson Natural Language Processing Syntax zapouzdřuje funkčnost syntaktické analýzy.

Názvy bloků

  • syntax_izumo_<language>_stock
  • syntax_izumo_<language>_stock-dp (pouze běhové prostředí 23.1 )

Podporované jazyky

Blok syntaktické analýzy je k dispozici pro následující jazyky. Seznam kódů jazyků a odpovídajících jazyků viz Kódy jazyků.

Kódy jazyků, které se mají použít pro model syntax_izumo_<language>_stock: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw

Jazykové kódy pro model syntax_izumo_<language>_stock-dp: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh

Seznam podporovaných jazyků pro každou úlohu syntaxe
Úloha Podporované kódy jazyků
Tokenizace af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Značkování části řeči af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Lemmatizace af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detekce věty af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detekce odstavce af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Analýza závislostí af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv

Funkce

Tento blok slouží k provádění úloh, jako je detekce vět, tokenizace, značkování slovních druhů, lemmatizace a analýza závislostí v různých jazycích. U většiny úloh budete pravděpodobně potřebovat pouze detekci vět, tokenizaci a značkování části řeči. Pro tyto případy použití použijte model syntax_model_xx_stock . Chcete-li spustit syntaktickou analýzu závislostí v běhovém prostředí 23.1, použijte model syntax_model_xx_stock-dp . V běhovém prostředí 22.2je syntaktická analýza závislostí zahrnuta v modelu syntax_model_xx_stock .

Analýza pro použití značek POS (Part-of-speech) a závislosti následuje za sadou značek Universal Parts of Speech (značky Universal POS) a sadou značek Universal Dependencies v2 (Universal Dependency Relations).

Následující tabulka zobrazuje schopnosti jednotlivých úloh na základě stejného příkladu a výsledku analýzy.

Schopnosti jednotlivých úloh syntaxe na základě příkladu
Funkce Příklady Atributy syntaktického analyzátoru
Tokenizace "V pondělí nemám rád" -- > "I", "do", "n' t", "jako", "V pondělí" token
Detekce funkce částečně Of_Speech "pondělí se mi nelíbí" -- > "I" \POS_PRON, "do "\POS_AUX, "n' t" \POS_PART, "like "\POS_VERB," Mondays " \POS_PROPN část_hlasového_projevu
Lemmatizace "Já nemám rád pondělí" -- > "Já", "dělat", "ne", "jako", "pondělí" lemma
Analýza závislostí "pondělí se mi nelíbí" -- > "I" -SUBJECT-> "like" < -OBJECT-"pondělí" závislost
Detekce věty "V pondělí se mi nelíbí" -- > vrací tuto větu Věta
Detekce odstavce (V současné době je detekce odstavce stále experimentální a vrací podobné výsledky jako detekce věty.) "V pondělí se mi nelíbí" -- > vrací tuto větu jako odstavec Věta

Závislosti na jiných blocích

Není

Ukázka kódu

import watson_nlp

# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')

# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))

# Print the syntax result
print(syntax_prediction)

Výstup ukázky kódu:

{
  "text": "I don't like Mondays",
  "producer_id": {
    "name": "Izumo Text Processing",
    "version": "0.0.1"
  },
  "tokens": [
    {
      "span": {
        "begin": 0,
        "end": 1,
        "text": "I"
      },
      "lemma": "I",
      "part_of_speech": "POS_PRON"
    },
    {
      "span": {
        "begin": 2,
        "end": 4,
        "text": "do"
      },
      "lemma": "do",
      "part_of_speech": "POS_AUX"
    },
    {
      "span": {
        "begin": 4,
        "end": 7,
        "text": "n't"
      },
      "lemma": "not",
      "part_of_speech": "POS_PART"
    },
    {
      "span": {
        "begin": 8,
        "end": 12,
        "text": "like"
      },
      "lemma": "like",
      "part_of_speech": "POS_VERB"
    },
    {
      "span": {
        "begin": 13,
        "end": 20,
        "text": "Mondays"
      },
      "lemma": "Monday",
      "part_of_speech": "POS_PROPN"
    }
  ],
  "sentences": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ],
  "paragraphs": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ]
}

Nadřízené téma: Watson Katalog úloh zpracování přirozeného jazyka

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more