Il blocco Watson Natural Language Processing Syntax contiene la funzionalità di analisi della sintassi.
Nomi blocco
syntax_izumo_<language>_stock
syntax_izumo_<language>_stock-dp
Lingue supportate
Il blocco di analisi della sintassi è disponibile per i seguenti linguaggi. Per un elenco dei codici lingua e della lingua corrispondente, consultare Codici lingua.
Codici lingua da utilizzare per il Modello syntax_izumo_<language>_stock
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw
Codici lingua da utilizzare per il modello syntax_izumo_<language>_stock-dp
: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh
Attività | Codici lingua supportati |
---|---|
Applicazione token | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, n, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Tag di parte del discorso | af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Lemmatizzazione | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, n, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Rilevamento frase | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, n, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Rilevamento paragrafo | af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, n, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh |
Analisi dipendenza | af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, n, nl, nn, pt, ro, ru, sk, sr, sv |
Funzioni
Utilizzare questo blocco per eseguire attività come il rilevamento della frase, la tokenizzazione, l'assegnazione di tag di parte del discorso, l'analisi della lemmatizzazione e della dipendenza in lingue differenti. Per la maggior parte delle attività, è probabile che siano necessari solo il rilevamento della frase, la tokenizzazione e l'applicazione di tag di parte del discorso. Per questi casi di utilizzo utilizzare il modello syntax_model_xx_stock
. Se si desidera eseguire l'analisi della dipendenza, utilizzare il modello syntax_model_xx_stock-dp
.
L'analisi per l'applicazione di tag POS (Part - of - speech) e le dipendenze segue le parti universali della serie di tag Speech (tag POS Universal) e la serie di tag v2 delle dipendenze universali (Universal Dependency Relations).
La seguente tabella mostra le funzionalità di ogni attività in base allo stesso esempio e il risultato dell'analisi.
Funzioni | Esempi | Attributi del programma di analisi |
---|---|---|
Applicazione token | "Non mi piacciono i lunedì" --> "I", "do", "n' t", "like", "lunedì" | gettone |
Rilevamento part - Of_Speech | "Non mi piacciono i lunedì" --> "I" \POS_PRON, "do "\POS_AUX, "n' t" \POS_PART, "like "\POS_VERB," Lunedì " \POS_PROPN | parte_di_discorso |
Lemmatizzazione | "Non mi piacciono i lunedì" --> "I", "do", "not", "like", "Monday" | lemma |
Analisi dipendenza | "Non mi piace il lunedì" --> "I" -SUBJECT -> "like" < -OBJECT - "Lunedì" | dipendenza |
Rilevamento frase | "Non mi piace il lunedì" --> restituisce questa frase | frase |
Rilevamento paragrafo (attualmente il rilevamento del paragrafo è ancora sperimentale e restituisce risultati simili al rilevamento della frase). | "Non mi piace lunedì" --> restituisce questa frase come un paragrafo | frase |
Dipendenze da altri blocchi
Nessuna
Esempio di codice
import watson_nlp
# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))
# Print the syntax result
print(syntax_prediction)
Output dell'esempio di codice:
{
"text": "I don't like Mondays",
"producer_id": {
"name": "Izumo Text Processing",
"version": "0.0.1"
},
"tokens": [
{
"span": {
"begin": 0,
"end": 1,
"text": "I"
},
"lemma": "I",
"part_of_speech": "POS_PRON"
},
{
"span": {
"begin": 2,
"end": 4,
"text": "do"
},
"lemma": "do",
"part_of_speech": "POS_AUX"
},
{
"span": {
"begin": 4,
"end": 7,
"text": "n't"
},
"lemma": "not",
"part_of_speech": "POS_PART"
},
{
"span": {
"begin": 8,
"end": 12,
"text": "like"
},
"lemma": "like",
"part_of_speech": "POS_VERB"
},
{
"span": {
"begin": 13,
"end": 20,
"text": "Mondays"
},
"lemma": "Monday",
"part_of_speech": "POS_PROPN"
}
],
"sentences": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
],
"paragraphs": [
{
"span": {
"begin": 0,
"end": 20,
"text": "I don't like Mondays"
}
}
]
}
Argomento principale: Watson Natural Language Processing task catalog