資料の 英語版 に戻る

テキスト分析ワークベンチ

最終更新: 2025年2月28日
テキスト分析ワークベンチ ( SPSS Modeler )

テキスト マイニング ノードから、フローの実行時に Text Analytics Workbench セッションを開始することを選択できます。 テキスト分析ワークベンチは、抽出結果を調べ、テキストマイニングノードの構成を微調整できる対話型セッションです。

テキストマイニング is an iterative process in which extraction results are reviewed according to the context of the text data, fine-tuned to produce new results, and then reevaluated. テキスト マイニング ノードを実行すると、抽出エンジンがテキスト データを読み取り、関連するコンセプトを識別し、それぞれにタイプを割り当てます。

テキスト マイニング ノードの実行が終了すると、テキスト分析ワークベンチが開き、抽出結果を確認できるようになります。 テキスト分析ワークベンチはタブで構成されています。 各タブでは、テキスト マイニング プロセスのさまざまな領域に焦点を当てることができます。

コンセプト
コンセプト、テキスト データから識別され抽出された重要な単語やフレーズです。 抽出結果とも呼ばれます。 これらのコンセプトは、「タイプ」にグループ化されます。 これらのコンセプトを使用して、データを探索し、カテゴリを作成できます。 コンセプトタブでコンセプトを管理できます。
テキスト・リンク
言語リソースにテキスト リンク分析 (TLA) ルールがある場合は、テキスト データからパターンを抽出できます。 たとえば、リソース テンプレートにはすでにいくつかの TLA ルールが含まれています。 これらのパターンを使用して、データのコンセプト間に興味深い関連を見つけることができます。 また、これらのパターンをカテゴリーの記述子として使用することもできます。 これらのパターンは、「テキスト リンク」 タブで管理できます。
カテゴリー
記述子 (抽出結果、パターン、ルールなど) を定義として使用して、カテゴリのセットを手動または自動で作成できます。 ドキュメントとレコードは、カテゴリ定義の一部が含まれているかどうかに基づいてこれらのカテゴリに割り当てられます。 「カテゴリ」 タブでカテゴリを管理できます。
リソース
抽出プロセスは、言語リソースからの一連のパラメータと定義に依存して、テキストの抽出方法と処理方法を制御します。 これらの言語リソース (テンプレートやライブラリなど) は、リソース エディター タブで調整できます。
図1: テキスト分析ワークベンチ
テキスト分析ワークベンチ

ワークベンチを使用して、次のテキスト マイニング タスクを実行できます。

  • テキストデータから重要なコンセプトを抽出する
  • カテゴリーを作成
  • テキストリンク分析(TLA)のパターンを探索する
  • カテゴリモデルナゲットを生成する
  • 抽出プロセス中に調整または使用したリソースをテキスト分析パッケージ (TAP) として保存します。