Translation not up to date
Blok Watson Natural Language Processing Syntax zapouzdřuje funkčnost syntaktické analýzy.
Názvy bloků
syntax_izumo_<language>_stock
syntax_izumo_<language>_stock-dp
(pouze běhové prostředí 23.1 )
Podporované jazyky
Blok syntaktické analýzy je k dispozici pro následující jazyky. Seznam kódů jazyků a odpovídajících jazyků viz Kódy jazyků.
Kódy jazyků, které se mají použít pro model syntax_izumo_<language>_stock
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw
Jazykové kódy pro model syntax_izumo_<language>_stock-dp
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh
Úloha | Podporované kódy jazyků |
---|---|
Tokenizace | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Značkování části řeči | af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Lemmatizace | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Detekce věty | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Detekce odstavce | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, on, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Analýza závislostí | af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv |
Funkce
Tento blok slouží k provádění úloh, jako je detekce vět, tokenizace, značkování slovních druhů, lemmatizace a analýza závislostí v různých jazycích. U většiny úloh budete pravděpodobně potřebovat pouze detekci vět, tokenizaci a značkování části řeči. Pro tyto případy použití použijte model syntax_model_xx_stock
. Chcete-li spustit syntaktickou analýzu závislostí v běhovém prostředí 23.1, použijte model syntax_model_xx_stock-dp
. V běhovém prostředí 22.2je syntaktická analýza závislostí zahrnuta v modelu syntax_model_xx_stock
.
Analýza pro použití značek POS (Part-of-speech) a závislosti následuje za sadou značek Universal Parts of Speech (značky Universal POS) a sadou značek Universal Dependencies v2 (Universal Dependency Relations).
Následující tabulka zobrazuje schopnosti jednotlivých úloh na základě stejného příkladu a výsledku analýzy.
Funkce | Příklady | Atributy syntaktického analyzátoru |
---|---|---|
Tokenizace | "V pondělí nemám rád" -- > "I", "do", "n' t", "jako", "V pondělí" | token |
Detekce funkce částečně Of_Speech | "pondělí se mi nelíbí" -- > "I" \POS_PRON, "do "\POS_AUX, "n' t" \POS_PART, "like "\POS_VERB," Mondays " \POS_PROPN | část_hlasového_projevu |
Lemmatizace | "Já nemám rád pondělí" -- > "Já", "dělat", "ne", "jako", "pondělí" | lemma |
Analýza závislostí | "pondělí se mi nelíbí" -- > "I" -SUBJECT-> "like" < -OBJECT-"pondělí" | závislost |
Detekce věty | "V pondělí se mi nelíbí" -- > vrací tuto větu | Věta |
Detekce odstavce (V současné době je detekce odstavce stále experimentální a vrací podobné výsledky jako detekce věty.) | "V pondělí se mi nelíbí" -- > vrací tuto větu jako odstavec | Věta |
Závislosti na jiných blocích
Není
Ukázka kódu
import watson_nlp
# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
# Print the syntax result
print(syntax_prediction)
Výstup ukázky kódu:
{
"text": "I don't like Mondays",
"producer_id": {
"name": "Izumo Text Processing",
"version": "0.0.1"
},
"tokens": [
{
"span": {
"begin": 0,
"end": 1,
"text": "I"
},
"lemma": "I",
"part_of_speech": "POS_PRON"
},
{
"span": {
"begin": 2,
"end": 4,
"text": "do"
},
"lemma": "do",
"part_of_speech": "POS_AUX"
},
{
"span": {
"begin": 4,
"end": 7,
"text": "n't"
},
"lemma": "not",
"part_of_speech": "POS_PART"
},
{
"span": {
"begin": 8,
"end": 12,
"text": "like"
},
"lemma": "like",
"part_of_speech": "POS_VERB"
},
{
"span": {
"begin": 13,
"end": 20,
"text": "Mondays"
},
"lemma": "Monday",
"part_of_speech": "POS_PROPN"
}
],
"sentences": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
],
"paragraphs": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
]
}
Nadřízené téma: Watson Katalog úloh zpracování přirozeného jazyka