資料の 英語版 に戻るテキスト分析ワークベンチ
テキスト分析ワークベンチ (SPSS Modeler)
最終更新: 2024年9月24日
テキスト・マイニング・ノードから、フローの実行時にテキスト分析ワークベンチ・セッションを開始することを選択できます。 Text Analytics Workbench は、抽出結果を探索し、テキスト・マイニング・ノードの構成を微調整できるインタラクティブ・セッションです。
テキストマイニング は、抽出結果がテキスト・データのコンテキストに従ってレビューされ、新しい結果が生成されるように微調整されてから再評価される反復プロセスです。 テキスト・マイニング・ノードを実行すると、抽出エンジンはテキスト・データを読み取り、関連するコンセプトを識別し、それぞれにタイプを割り当てます。
Text Mining ノードの実行が終了すると、Text Analytics Workbench が開き、抽出結果を確認できます。 テキスト分析ワークベンチは、タブに編成されています。 各タブでは、テキスト・マイニング・プロセスのさまざまな領域に焦点を当てることができます。
- コンセプト
- コンセプトは、テキスト・データから識別および抽出された重要な語句です。 これらは、 抽出結果とも呼ばれます。 これらのコンセプトは、「タイプ」にグループ化されます。 これらのコンセプトを使用して、データを探索し、カテゴリーを作成することができます。 「概念」 タブで概念を管理できます。
- テキスト・リンク
- 言語リソースにテキストリンク分析 (TLA) 規則がある場合は、テキスト・データからパターンを抽出できます。 例えば、リソース・テンプレートには既にいくつかの TLA 規則があります。 これらのパターンを使用して、データのコンセプト間に興味深い関連を見つけることができます。 また、これらのパターンをカテゴリーの記述子として使用することもできます。 これらのパターンは、 「テキスト・リンク」 タブで管理できます。
- カテゴリー
- 記述子 (抽出結果、パターン、規則など) を定義として使用して、一連のカテゴリーを手動または自動で作成することができます。 ドキュメントおよびレコードは、カテゴリー定義の一部が含まれているかどうかに基づいて、これらのカテゴリーに割り当てられます。 「カテゴリー」 タブでカテゴリーを管理できます。
- リソース
- 抽出プロセスは、テキストの抽出方法と処理方法を制御するために、言語リソースからの一連のパラメーターと定義に依存します。 これらの言語リソース(テンプレートやライブラリなど)は、リソースエディタタブで調整できます。
ワークベンチを使用して、以下のテキストマイニング作業を行うことができます:
- テキスト・データから主要な概念を抽出する
- カテゴリーを作成
- テキストリンク分析 (TLA) でのパターンの探索
- カテゴリー・モデル・ナゲットの生成
- 抽出プロセスでチューニングした、または使用したリソースをテキスト分析パッケージ(TAP)として保存します。