Watson Natural Language Processing Categories ブロックは、階層分類内の個々のノードを入力文書に割り当てます。 例えば、 IBM が量子コンピューティングの新たな進歩を発表するというテキストでは、抽出されたカテゴリーの例として technology and computing/hardware/computer
と technology and computing/operating systems
があります。 これらのカテゴリーは、階層分類のレベル 3 およびレベル 2 のノードを表します。
このブロックは、トレーニングが分類内の各ノードに関連付けられた一連のシード語句から開始され、ラベル付き文書を必要としないという点で、分類ブロックとは異なります。
階層テキスト・カテゴリー化ブロックは、 Watson Natural Language Processing ライブラリーを含む環境で開始されたノートブックでのみ使用できることに注意してください。
ブロック名
categories_esa_en_stock
サポート対象言語
「カテゴリー」ブロックは、以下の言語で使用できます。 言語コードおよび対応する言語のリストについては、『言語コード』を参照してください。
de、en
機能
このブロックを使用して、Web ページを一般的なドメイン・トピックの分類に分類し、広告の配置とコンテンツの推奨を行うことにより、Web 上の文書のトピックを判別します。 モデルは、ニュース・レポートや一般的な Web ページからのデータでテストされました。
返される可能性があるカテゴリーのリストについては、 カテゴリー・タイプを参照してください。
他のブロックへの依存関係
階層カテゴリー化ブロックを実行する前に、以下のブロックを実行する必要があります。
syntax_izumo_<language>_stock
コード・サンプル
import watson_nlp
# Load Syntax and a Categories model for English
syntax_model = watson_nlp.load('syntax_izumo_en_stock')
categories_model = watson_nlp.load('categories_esa_en_stock')
# Run the syntax model on the input text
syntax_prediction = syntax_model.run('IBM announced new advances in quantum computing')
# Run the categories model on the result of syntax
categories = categories_model.run(syntax_prediction)
print(categories)
コード・サンプルの出力:
{
"categories": [
{
"labels": [
"technology & computing",
"computing"
],
"score": 0.992489,
"explanation": []
},
{
"labels": [
"science",
"physics"
],
"score": 0.945449,
"explanation": []
}
],
"producer_id": {
"name": "ESA Hierarchical Categories",
"version": "1.0.0"
}
}