Le bloc de syntaxe Watson Natural Language Processing encapsule la fonctionnalité d'analyse syntaxique.
Noms de bloc
syntax_izumo_<language>_stock
syntax_izumo_<language>_stock-dp
Langues prises en charge
Le bloc d'analyse de syntaxe est disponible pour les langues suivantes. Pour obtenir la liste des codes de langue et de la langue correspondante, voir Codes de langue.
Codes de langue à utiliser pour le modèle syntax_izumo_<language>_stock
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw
Codes de langue à utiliser pour le modèle syntax_izumo_<language>_stock-dp
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh
Tâche | Codes de langue pris en charge |
---|---|
Segmentation en unités | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Étiquetage de la partie de la langue | af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Lemmatisation | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Détection des phrases | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Détection de paragraphe | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Analyse syntaxique des dépendances | Af, ar, bs, cs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv |
Capacités
Utilisez ce bloc pour effectuer des tâches telles que la détection des phrases, le marquage sémantique, le balisage de la partie de la parole, la lemmatisation et l'analyse des dépendances dans différentes langues. Pour la plupart des tâches, vous n'aurez probablement besoin que de la détection de phrases, du marquage sémantique et du balisage de la partie de la parole. Pour ces cas d'utilisation, utilisez le modèle syntax_model_xx_stock
. Si vous souhaitez exécuter l'analyse syntaxique des dépendances, utilisez le modèle syntax_model_xx_stock-dp
.
L'analyse des balises TPV (Part of speech) et des dépendances suit les composants Universal Parts of Speech tagset (Balises TPV universelles) et Universal Dependencies v2 tagset (Relations de dépendance universelles).
Le tableau suivant montre les capacités de chaque tâche en fonction du même exemple et du résultat de l'analyse.
Capacités | Exemples | Attributs de l'analyseur syntaxique |
---|---|---|
Segmentation en unités | "Je n'aime pas les lundis" -- > "Je", "n'", "aime", "pas", "les lundis" | jeton |
Détection des parties de la parole | "Je n'aime pas les lundis" -- > "Je" \POS_PRON, "n'aime "\POS_AUX, "pas" \POS_PART, "les "\POS_VERB," Lundis " \POS_PROPN | part_of_speech |
Lemmatisation | "Je n'aime pas les lundis" -- > "Je", "n'aime", "pas", "les", "lundis" | lemme |
Analyse syntaxique des dépendances | "Je n'aime pas les lundis" -- > "Je" -OBJET-> "n'aime" < -OBJECT-"lundis" | dépendance |
Détection des phrases | "Je n'aime pas les lundis" -- > retourne cette phrase | phrase |
Détection de paragraphe (Actuellement, la détection de paragraphe est encore expérimentale et renvoie des résultats similaires à la détection des phrases.) | "Je n'aime pas les lundis" -- > retourne cette phrase comme un paragraphe | phrase |
Dépendances sur d'autres blocs
Aucun
Exemple de code
import watson_nlp
# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
# Print the syntax result
print(syntax_prediction)
Sortie de l'exemple de code :
{
"text": "I don't like Mondays",
"producer_id": {
"name": "Izumo Text Processing",
"version": "0.0.1"
},
"tokens": [
{
"span": {
"begin": 0,
"end": 1,
"text": "I"
},
"lemma": "I",
"part_of_speech": "POS_PRON"
},
{
"span": {
"begin": 2,
"end": 4,
"text": "do"
},
"lemma": "do",
"part_of_speech": "POS_AUX"
},
{
"span": {
"begin": 4,
"end": 7,
"text": "n't"
},
"lemma": "not",
"part_of_speech": "POS_PART"
},
{
"span": {
"begin": 8,
"end": 12,
"text": "like"
},
"lemma": "like",
"part_of_speech": "POS_VERB"
},
{
"span": {
"begin": 13,
"end": 20,
"text": "Mondays"
},
"lemma": "Monday",
"part_of_speech": "POS_PROPN"
}
],
"sentences": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
],
"paragraphs": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
]
}
Rubrique parent: Watson Natural Language Processing