El bloque de sintaxis de Watson Natural Language Processing encapsula la funcionalidad de análisis de sintaxis.
Nombres de bloque
syntax_izumo_<language>_stock
syntax_izumo_<language>_stock-dp
Idiomas soportados
El bloque de análisis de sintaxis está disponible para los siguientes idiomas. Para obtener una lista de los códigos de idioma y el idioma correspondiente, consulte Códigos de idioma.
Códigos de idioma a utilizar para el modelo syntax_izumo_<language>_stock
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw
Códigos de idioma a utilizar para el modelo syntax_izumo_<language>_stock-dp
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh
Tarea | Códigos de idioma soportados |
---|---|
Señalización | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Etiquetado de la categoría léxica | af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Lematización | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Detección de frases | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Detección de párrafos | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Análisis de dependencias | af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv |
Prestaciones
Utilice este bloque para realizar tareas como la detección de sentencias, la tokenización, el etiquetado de la categoría léxica, la lematización y el análisis de dependencias en diferentes idiomas. Para la mayoría de las tareas, probablemente sólo necesitará la detección de frases, la tokenización y el etiquetado de categorías léxicas. Para estos casos de uso, utilice el modelo syntax_model_xx_stock
. Si desea ejecutar el análisis de dependencias, utilice el modelo syntax_model_xx_stock-dp
.
El análisis para el etiquetado y las dependencias de la categoría léxica (POS) sigue el conjunto de etiquetas Universal Parts of Speech (Etiquetas POS universales) y el conjunto de etiquetas de dependencias universales v2 (Relaciones de dependencias universales).
La tabla siguiente muestra las prestaciones de cada tarea basándose en el mismo ejemplo y el resultado en el análisis.
Prestaciones | Ejemplos | Atributos de analizador |
---|---|---|
Señalización | "I don't like Mondays" --> "I" , "do", "n't", "like", "Mondays" | señal |
Detección de Part-Of_Speech | "I don't like Mondays" --> "I"\POS_PRON, "do"\POS_AUX, "n't"\POS_PART, "like"\POS_VERB, "Mondays"\POS_PROPN | part_of_speech |
Lematización | "I don't like Mondays" --> "I", "do", "not", "like", "Monday" | lema |
Análisis de dependencias | "I don't like Mondays" --> "I"-SUBJECT->"like"<-OBJECT-"Mondays" | dependencia |
Detección de frases | "I don't like Mondays" --> devuelve esta frase | sentence |
Detección de párrafos (actualmente la detección de párrafos sigue siendo experimental y devuelve resultados similares a la detección de frases.) | "I don't like Mondays" --> devuelve esta frase como un párrafo | sentence |
Dependencias de otros bloques
Ninguna
Ejemplo de código
import watson_nlp
# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
# Print the syntax result
print(syntax_prediction)
Ejemplo de salida de código:
{
"text": "I don't like Mondays",
"producer_id": {
"name": "Izumo Text Processing",
"version": "0.0.1"
},
"tokens": [
{
"span": {
"begin": 0,
"end": 1,
"text": "I"
},
"lemma": "I",
"part_of_speech": "POS_PRON"
},
{
"span": {
"begin": 2,
"end": 4,
"text": "do"
},
"lemma": "do",
"part_of_speech": "POS_AUX"
},
{
"span": {
"begin": 4,
"end": 7,
"text": "n't"
},
"lemma": "not",
"part_of_speech": "POS_PART"
},
{
"span": {
"begin": 8,
"end": 12,
"text": "like"
},
"lemma": "like",
"part_of_speech": "POS_VERB"
},
{
"span": {
"begin": 13,
"end": 20,
"text": "Mondays"
},
"lemma": "Monday",
"part_of_speech": "POS_PROPN"
}
],
"sentences": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
],
"paragraphs": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
]
}
Tema principal: Watson