Watson 자연어 처리 카테고리 블록은 계층 구조 택소노미 내의 개별 노드를 입력 문서에 지정합니다. 예를 들어, IBM 이 퀀텀 컴퓨팅 (quantum computing)에서 새로운 개선사항을 발표하는 텍스트에서 추출된 카테고리의 예는 technology and computing/hardware/computer
및 technology and computing/operating systems
입니다. 이러한 카테고리는 계층 구조 분류의 레벨 3및 레벨 2노드를 나타냅니다.
이 블록은 분류의 각 노드와 연관된 시드 구문 세트에서 훈련이 시작되고 레이블이 지정된 문서가 필요하지 않다는 점에서 분류 블록과 다릅니다.
계층 구조 텍스트 분류 블록은 Watson 자연어 처리 라이브러리를 포함하는 환경에서 시작되는 노트북에서만 사용할 수 있습니다.
블록 이름
categories_esa_en_stock
지원되는 언어
카테고리 블록은 다음 언어로 사용할 수 있습니다. 언어 코드 및 해당 언어 목록은 언어 코드를 참조하십시오.
de, ko
기능
이 블록을 사용하여 광고 배치 및 컨텐츠 권장사항을 위해 웹 페이지를 일반 도메인 주제의 분류로 분류하여 웹에서 문서의 주제를 판별하십시오. 이 모델은 뉴스 보고서 및 일반 웹 페이지의 데이터에서 테스트되었습니다.
리턴될 수 있는 카테고리 목록은 카테고리 유형을 참조하십시오.
다른 블록에 대한 종속성
계층 구조 분류 블록을 실행하기 전에 다음 블록을 실행해야 합니다.
syntax_izumo_<language>_stock
코드 샘플
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
코드 샘플의 출력:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}