Syntaktická analýza

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

Syntaktická analýza

Last updated: 30. 10. 2023

Syntaktická analýza

Blok Watson Natural Language Processing Syntax zapouzdřuje funkčnost syntaktické analýzy.

Názvy bloků

syntax_izumo_<language>_stock
syntax_izumo_<language>_stock-dp (pouze běhové prostředí 23.1 )

Podporované jazyky

Blok syntaktické analýzy je k dispozici pro následující jazyky. Seznam kódů jazyků a odpovídajících jazyků viz Kódy jazyků.

Kódy jazyků, které se mají použít pro model syntax_izumo_<language>_stock: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw

Jazykové kódy pro model syntax_izumo_<language>_stock-dp: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh

Seznam podporovaných jazyků pro každou úlohu syntaxe
Úloha	Podporované kódy jazyků
Tokenizace	af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Značkování části řeči	af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Lemmatizace	af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detekce věty	af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detekce odstavce	af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Analýza závislostí	af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv

Funkce

Tento blok slouží k provádění úloh, jako je detekce vět, tokenizace, značkování slovních druhů, lemmatizace a analýza závislostí v různých jazycích. U většiny úloh budete pravděpodobně potřebovat pouze detekci vět, tokenizaci a značkování části řeči. Pro tyto případy použití použijte model syntax_model_xx_stock . Chcete-li spustit syntaktickou analýzu závislostí v běhovém prostředí 23.1, použijte model syntax_model_xx_stock-dp . V běhovém prostředí 22.2je syntaktická analýza závislostí zahrnuta v modelu syntax_model_xx_stock .

Analýza pro použití značek POS (Part-of-speech) a závislosti následuje za sadou značek Universal Parts of Speech (značky Universal POS) a sadou značek Universal Dependencies v2 (Universal Dependency Relations).

Následující tabulka zobrazuje schopnosti jednotlivých úloh na základě stejného příkladu a výsledku analýzy.

Schopnosti jednotlivých úloh syntaxe na základě příkladu
Funkce	Příklady	Atributy syntaktického analyzátoru
Tokenizace	"V pondělí nemám rád" -- > "I", "do", "n' t", "jako", "V pondělí"	token
Detekce funkce částečně Of_Speech	"pondělí se mi nelíbí" -- > "I" \POS_PRON, "do "\POS_AUX, "n' t" \POS_PART, "like "\POS_VERB," Mondays " \POS_PROPN	část_hlasového_projevu
Lemmatizace	"Já nemám rád pondělí" -- > "Já", "dělat", "ne", "jako", "pondělí"	lemma
Analýza závislostí	"pondělí se mi nelíbí" -- > "I" -SUBJECT-> "like" < -OBJECT-"pondělí"	závislost
Detekce věty	"V pondělí se mi nelíbí" -- > vrací tuto větu	Věta
Detekce odstavce (V současné době je detekce odstavce stále experimentální a vrací podobné výsledky jako detekce věty.)	"V pondělí se mi nelíbí" -- > vrací tuto větu jako odstavec	Věta

Závislosti na jiných blocích

Není

Ukázka kódu

import watson_nlp

# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')

# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))

# Print the syntax result
print(syntax_prediction)

Výstup ukázky kódu:

{
  "text": "I don't like Mondays",
  "producer_id": {
    "name": "Izumo Text Processing",
    "version": "0.0.1"
  },
  "tokens": [
    {
      "span": {
        "begin": 0,
        "end": 1,
        "text": "I"
      },
      "lemma": "I",
      "part_of_speech": "POS_PRON"
    },
    {
      "span": {
        "begin": 2,
        "end": 4,
        "text": "do"
      },
      "lemma": "do",
      "part_of_speech": "POS_AUX"
    },
    {
      "span": {
        "begin": 4,
        "end": 7,
        "text": "n't"
      },
      "lemma": "not",
      "part_of_speech": "POS_PART"
    },
    {
      "span": {
        "begin": 8,
        "end": 12,
        "text": "like"
      },
      "lemma": "like",
      "part_of_speech": "POS_VERB"
    },
    {
      "span": {
        "begin": 13,
        "end": 20,
        "text": "Mondays"
      },
      "lemma": "Monday",
      "part_of_speech": "POS_PROPN"
    }
  ],
  "sentences": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ],
  "paragraphs": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ]
}

Nadřízené téma: Watson Katalog úloh zpracování přirozeného jazyka