階層テキストのカテゴリー化
Watson Natural Language Processing Categories ブロックは、階層分類内の個々のノードを入力文書に割り当てます。 例えば、 IBM が量子コンピューティングの新たな進歩を発表するというテキストでは、抽出されたカテゴリーの例として
と technology and computing/hardware/computer
があります。 これらのカテゴリーは、階層分類のレベル 3 およびレベル 2 のノードを表します。technology and computing/operating systems
このブロックは、トレーニングが分類内の各ノードに関連付けられた一連のシード語句から開始され、ラベル付き文書を必要としないという点で、分類ブロックとは異なります。
階層テキスト・カテゴリー化ブロックは、 Watson Natural Language Processing ライブラリーを含む環境で開始されたノートブックでのみ使用できることに注意してください。
ブロック名
categories_esa_en_stock
サポート対象言語
英語では、カテゴリーブロックが利用可能です
機能
このブロックを使用して、Web ページを一般的なドメイン・トピックの分類に分類し、広告の配置とコンテンツの推奨を行うことにより、Web 上の文書のトピックを判別します。 モデルは、ニュース・レポートや一般的な Web ページからのデータでテストされました。
返される可能性があるカテゴリーのリストについては、 カテゴリー・タイプを参照してください。
他のブロックへの依存関係
階層カテゴリー化ブロックを実行する前に、以下のブロックを実行する必要があります。
syntax_izumo_<language>_stock
コード・サンプル
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
コード・サンプルの出力:
{ "categories": [ { "labels": [ "technology & computing", "computing" ], "score": 0.992489, "explanation": [] }, { "labels": [ "science", "physics" ], "score": 0.945449, "explanation": [] } ], "producer_id": { "name": "ESA Hierarchical Categories", "version": "1.0.0" } }