0 / 0
Retourner à la version anglaise de la documentation
Analyse de syntaxe
Dernière mise à jour : 22 juil. 2024
Analyse de syntaxe

Le bloc de syntaxe Watson Natural Language Processing encapsule la fonctionnalité d'analyse syntaxique.

Noms de bloc

  • syntax_izumo_<language>_stock
  • syntax_izumo_<language>_stock-dp

Langues prises en charge

Le bloc d'analyse de syntaxe est disponible pour les langues suivantes. Pour obtenir la liste des codes de langue et de la langue correspondante, voir Codes de langue.

Codes de langue à utiliser pour le modèle syntax_izumo_<language>_stock: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw

Codes de langue à utiliser pour le modèle syntax_izumo_<language>_stock-dp: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh

Liste des langues prises en charge pour chaque tâche de syntaxe
Tâche Codes de langue pris en charge
Segmentation en unités af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Étiquetage de la partie de la langue af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Lemmatisation af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Détection des phrases af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Détection de paragraphe af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
Analyse syntaxique des dépendances Af, ar, bs, cs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv

Capacités

Utilisez ce bloc pour effectuer des tâches telles que la détection des phrases, le marquage sémantique, le balisage de la partie de la parole, la lemmatisation et l'analyse des dépendances dans différentes langues. Pour la plupart des tâches, vous n'aurez probablement besoin que de la détection de phrases, du marquage sémantique et du balisage de la partie de la parole. Pour ces cas d'utilisation, utilisez le modèle syntax_model_xx_stock . Si vous souhaitez exécuter l'analyse syntaxique des dépendances, utilisez le modèle syntax_model_xx_stock-dp .

L'analyse des balises TPV (Part of speech) et des dépendances suit les composants Universal Parts of Speech tagset (Balises TPV universelles) et Universal Dependencies v2 tagset (Relations de dépendance universelles).

Le tableau suivant montre les capacités de chaque tâche en fonction du même exemple et du résultat de l'analyse.

Fonctions de chaque tâche de syntaxe basée sur un exemple
Capacités Exemples Attributs de l'analyseur syntaxique
Segmentation en unités "Je n'aime pas les lundis" -- > "Je", "n'", "aime", "pas", "les lundis" jeton
Détection des parties de la parole "Je n'aime pas les lundis" -- > "Je" \POS_PRON, "n'aime "\POS_AUX, "pas" \POS_PART, "les "\POS_VERB," Lundis " \POS_PROPN part_of_speech
Lemmatisation "Je n'aime pas les lundis" -- > "Je", "n'aime", "pas", "les", "lundis" lemme
Analyse syntaxique des dépendances "Je n'aime pas les lundis" -- > "Je" -OBJET-> "n'aime" < -OBJECT-"lundis" dépendance
Détection des phrases "Je n'aime pas les lundis" -- > retourne cette phrase phrase
Détection de paragraphe (Actuellement, la détection de paragraphe est encore expérimentale et renvoie des résultats similaires à la détection des phrases.) "Je n'aime pas les lundis" -- > retourne cette phrase comme un paragraphe phrase

Dépendances sur d'autres blocs

Aucun

Exemple de code

import watson_nlp

# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')

# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))

# Print the syntax result
print(syntax_prediction)

Sortie de l'exemple de code :

{
  "text": "I don't like Mondays",
  "producer_id": {
    "name": "Izumo Text Processing",
    "version": "0.0.1"
  },
  "tokens": [
    {
      "span": {
        "begin": 0,
        "end": 1,
        "text": "I"
      },
      "lemma": "I",
      "part_of_speech": "POS_PRON"
    },
    {
      "span": {
        "begin": 2,
        "end": 4,
        "text": "do"
      },
      "lemma": "do",
      "part_of_speech": "POS_AUX"
    },
    {
      "span": {
        "begin": 4,
        "end": 7,
        "text": "n't"
      },
      "lemma": "not",
      "part_of_speech": "POS_PART"
    },
    {
      "span": {
        "begin": 8,
        "end": 12,
        "text": "like"
      },
      "lemma": "like",
      "part_of_speech": "POS_VERB"
    },
    {
      "span": {
        "begin": 13,
        "end": 20,
        "text": "Mondays"
      },
      "lemma": "Monday",
      "part_of_speech": "POS_PROPN"
    }
  ],
  "sentences": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ],
  "paragraphs": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ]
}

Rubrique parent: Watson Natural Language Processing

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus