0 / 0
영어 버전 문서로 돌아가기
구문 분석
마지막 업데이트 날짜: 2024년 7월 29일
구문 분석

Watson 자연어 처리 구문 블록은 구문 분석 기능을 캡슐화합니다.

블록 이름.

  • syntax_izumo_<language>_stock
  • syntax_izumo_<language>_stock-dp

지원되는 언어

구문 분석 블록은 다음 언어로 사용할 수 있습니다. 언어 코드 및 해당 언어 목록은 언어 코드를 참조하십시오.

모델 syntax_izumo_<language>_stock에 사용할 언어 코드: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw

모델 syntax_izumo_<language>_stock-dp에 사용할 언어 코드: af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, he, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh

각 구문 태스크에 대해 지원되는 언어 목록
태스크 지원되는 언어 코드
토큰화 af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, 그, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
품사 태깅 af, ar, bs, ca, cs, da, de, nl, nn, el, en, es, fi, fr, 그, hi, hr, it, ja, ko, nb, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
표제어 af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, 그, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
문장 감지 af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, 그, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
단락 감지 af, ar, bs, ca, cs, da, de, el, en, es, fi, fr, 그, hi, hr, it, ja, ko, nb, nl, nn, pl, pt, ro, ru, sk, sr, sv, tr, zh_cn, zh_tw, zh
종속성 구문 분석 af, ar, bs, cs, da, de, en, es, fi, fr, hi, hr, it, ja, nb, nl, nn, pt, ro, ru, sk, sr, sv

기능

이 블록을 사용하여 구문 감지, 토큰화, 품사 태그 지정, 표제어 및 종속성 구문 분석과 같은 태스크를 서로 다른 언어로 수행할 수 있습니다. 대부분의 태스크에는 문장 발견, 토큰화 및 품사 태그 지정만 필요합니다. 이러한 유스 케이스의 경우 syntax_model_xx_stock 모델을 사용하십시오. 종속성 구문 분석을 실행하려면 syntax_model_xx_stock-dp 모델을 사용하십시오.

POS(품사) 태깅 및 종속성에 대한 분석은 음성 태그셋(범용 POS 태그) 및 Universal Dependencies v2 태그셋(유니버셜 종속성 관계)의 범용 파트를 따릅니다.

다음 테이블은 동일한 예제를 기반으로 각 태스크의 기능과 구문 분석에 대한 결과를 보여줍니다.

예제를 기반으로 하는 각 구문 태스크의 기능
기능 구문 분석기 속성
토큰화 "I don't like Mondays" --> "I" , "do", "n't", "like", "Mondays" 토큰
Part-Of_Speech 감지 "I don't like Mondays" --> "I"\POS_PRON, "do"\POS_AUX, "n't"\POS_PART, "like"\POS_VERB, "Mondays"\POS_PROPN part_of_speech
표제어 "I don't like Mondays" --> "I", "do", "not", "like", "Monday" 표제어(lemma)
종속성 구문 분석 "I don't like Mondays" --> "I"-SUBJECT->"like"<-OBJECT-"Mondays" 종속성
문장 감지 "I don't like Mondays" -- > 이 문장을 리턴합니다. 문장
단락 감지(현재 단락 발견은 여전히 실험적이며 문장 감지와 유사한 결과를 리턴합니다.) "I don't like Mondays" -- > 이 문장을 단락으로 리턴합니다. 문장

다른 블록에 대한 종속성

없음

코드 샘플

import watson_nlp

# Load Syntax for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')

# Detect tokens, lemma and part-of-speech
text = 'I don\'t like Mondays'
syntax_prediction = syntax_model.run(text, parsers=('token', 'lemma', 'part_of_speech'))

# Print the syntax result
print(syntax_prediction)

코드 샘플의 출력:

{
  "text": "I don't like Mondays",
  "producer_id": {
    "name": "Izumo Text Processing",
    "version": "0.0.1"
  },
  "tokens": [
    {
      "span": {
        "begin": 0,
        "end": 1,
        "text": "I"
      },
      "lemma": "I",
      "part_of_speech": "POS_PRON"
    },
    {
      "span": {
        "begin": 2,
        "end": 4,
        "text": "do"
      },
      "lemma": "do",
      "part_of_speech": "POS_AUX"
    },
    {
      "span": {
        "begin": 4,
        "end": 7,
        "text": "n't"
      },
      "lemma": "not",
      "part_of_speech": "POS_PART"
    },
    {
      "span": {
        "begin": 8,
        "end": 12,
        "text": "like"
      },
      "lemma": "like",
      "part_of_speech": "POS_VERB"
    },
    {
      "span": {
        "begin": 13,
        "end": 20,
        "text": "Mondays"
      },
      "lemma": "Monday",
      "part_of_speech": "POS_PROPN"
    }
  ],
  "sentences": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ],
  "paragraphs": [
    {
      "span": {
        "begin": 0,
        "end": 20,
        "text": "I don't like Mondays"
      }
    }
  ]
}

상위 주제: Watson Natural Language Processing 태스크 카탈로그

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기