0 / 0
영어 버전 문서로 돌아가기
계층 구조 텍스트 분류
마지막 업데이트 날짜: 2024년 7월 29일
계층 구조 텍스트 분류

Watson 자연어 처리 카테고리 블록은 계층 구조 택소노미 내의 개별 노드를 입력 문서에 지정합니다. 예를 들어, IBM 이 퀀텀 컴퓨팅 (quantum computing)에서 새로운 개선사항을 발표하는 텍스트에서 추출된 카테고리의 예는 technology and computing/hardware/computertechnology and computing/operating systems입니다. 이러한 카테고리는 계층 구조 분류의 레벨 3및 레벨 2노드를 나타냅니다.

이 블록은 분류의 각 노드와 연관된 시드 구문 세트에서 훈련이 시작되고 레이블이 지정된 문서가 필요하지 않다는 점에서 분류 블록과 다릅니다.

계층 구조 텍스트 분류 블록은 Watson 자연어 처리 라이브러리를 포함하는 환경에서 시작되는 노트북에서만 사용할 수 있습니다.

블록 이름

categories_esa_en_stock

지원되는 언어

카테고리 블록은 다음 언어로 사용할 수 있습니다. 언어 코드 및 해당 언어 목록은 언어 코드를 참조하십시오.

de, ko

기능

이 블록을 사용하여 광고 배치 및 컨텐츠 권장사항을 위해 웹 페이지를 일반 도메인 주제의 분류로 분류하여 웹에서 문서의 주제를 판별하십시오. 이 모델은 뉴스 보고서 및 일반 웹 페이지의 데이터에서 테스트되었습니다.

리턴될 수 있는 카테고리 목록은 카테고리 유형을 참조하십시오.

다른 블록에 대한 종속성

계층 구조 분류 블록을 실행하기 전에 다음 블록을 실행해야 합니다.

  • syntax_izumo_<language>_stock

코드 샘플

import watson_nlp

# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')

# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')

# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)

코드 샘플의 출력:

{
  "categories": [
    {
      "labels": [
        "technology & computing",
        "computing"
      ],
      "score": 0.992489,
      "explanation": []
    },
    {
      "labels": [
        "science",
        "physics"
      ],
      "score": 0.945449,
      "explanation": []
    }
  ],
  "producer_id": {
    "name": "ESA Hierarchical Categories",
    "version": "1.0.0"
  }
}

상위 주제: Watson Natural Language Processing 태스크 카탈로그

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기