0 / 0
Volver a la versión inglesa de la documentación
Análisis de sintaxis
Última actualización: 29 jul 2024
Análisis de sintaxis

El bloque de sintaxis de Watson Natural Language Processing encapsula la funcionalidad de análisis de sintaxis.

Nombres de bloque

  • syntax_izumo_<language>_stock
  • syntax_izumo_<language>_stock-dp

Idiomas soportados

El bloque de análisis de sintaxis está disponible para los siguientes idiomas. Para obtener una lista de los códigos de idioma y el idioma correspondiente, consulte Códigos de idioma.

Códigos de idioma a utilizar para el modelo syntax_izumo_<language>_stock: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw

Códigos de idioma a utilizar para el modelo syntax_izumo_<language>_stock-dp: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh

Lista de los idiomas soportados para cada tarea de sintaxis
Tarea Códigos de idioma soportados
Señalización af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Etiquetado de la categoría léxica af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Lematización af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detección de frases af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Detección de párrafos af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Análisis de dependencias af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv

Prestaciones

Utilice este bloque para realizar tareas como la detección de sentencias, la tokenización, el etiquetado de la categoría léxica, la lematización y el análisis de dependencias en diferentes idiomas. Para la mayoría de las tareas, probablemente sólo necesitará la detección de frases, la tokenización y el etiquetado de categorías léxicas. Para estos casos de uso, utilice el modelo syntax_model_xx_stock . Si desea ejecutar el análisis de dependencias, utilice el modelo syntax_model_xx_stock-dp .

El análisis para el etiquetado y las dependencias de la categoría léxica (POS) sigue el conjunto de etiquetas Universal Parts of Speech (Etiquetas POS universales) y el conjunto de etiquetas de dependencias universales v2 (Relaciones de dependencias universales).

La tabla siguiente muestra las prestaciones de cada tarea basándose en el mismo ejemplo y el resultado en el análisis.

Prestaciones de cada tarea de sintaxis basada en un ejemplo
Prestaciones Ejemplos Atributos de analizador
Señalización "I don't like Mondays" --> "I" , "do", "n't", "like", "Mondays" señal
Detección de Part-Of_Speech "I don't like Mondays" --> "I"\POS_PRON, "do"\POS_AUX, "n't"\POS_PART, "like"\POS_VERB, "Mondays"\POS_PROPN part_of_speech
Lematización "I don't like Mondays" --> "I", "do", "not", "like", "Monday" lema
Análisis de dependencias "I don't like Mondays" --> "I"-SUBJECT->"like"<-OBJECT-"Mondays" dependencia
Detección de frases "I don't like Mondays" --> devuelve esta frase sentence
Detección de párrafos (actualmente la detección de párrafos sigue siendo experimental y devuelve resultados similares a la detección de frases.) "I don't like Mondays" --> devuelve esta frase como un párrafo sentence

Dependencias de otros bloques

Ninguna

Ejemplo de código

import watson_nlp

# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')

# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))

# Print the syntax result
print(syntax_prediction)

Ejemplo de salida de código:

{
  "text": "I don't like Mondays",
  "producer_id": {
    "name": "Izumo Text Processing",
    "version": "0.0.1"
  },
  "tokens": [
    {
      "span": {
        "begin": 0,
        "end": 1,
        "text": "I"
      },
      "lemma": "I",
      "part_of_speech": "POS_PRON"
    },
    {
      "span": {
        "begin": 2,
        "end": 4,
        "text": "do"
      },
      "lemma": "do",
      "part_of_speech": "POS_AUX"
    },
    {
      "span": {
        "begin": 4,
        "end": 7,
        "text": "n't"
      },
      "lemma": "not",
      "part_of_speech": "POS_PART"
    },
    {
      "span": {
        "begin": 8,
        "end": 12,
        "text": "like"
      },
      "lemma": "like",
      "part_of_speech": "POS_VERB"
    },
    {
      "span": {
        "begin": 13,
        "end": 20,
        "text": "Mondays"
      },
      "lemma": "Monday",
      "part_of_speech": "POS_PROPN"
    }
  ],
  "sentences": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ],
  "paragraphs": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ]
}

Tema principal: Watson

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información