SPSS Modeler がテキストデータから概念とタイプを抽出したら、カテゴリーの構築を開始できます。 テキスト分析ワークベンチでは、カテゴリタブを使用して、カテゴリを作成し、探索することができます。
カテゴリータブでは、記述子を使用してカテゴリーを構築することができます。 以下に、それらの用語の定義を示します。
- カテゴリー
- カテゴリーは、文書とレコードがスコアリング・プロセスを通じて割り当てられる、密接に関連したアイデアとパターンのグループです。 これらは、関連するコンセプトとパターンをより大きなグループに編成します。これにより、作業が容易になります。 カテゴリーは、コンセプト、タイプ、ルール、およびパターンの組み合わせです。
- 記述子
- 記述子は、レコードまたは文書がカテゴリーに属しているかどうかを識別するために使用されます。 すべてのカテゴリーは、コンセプト、タイプ、規則などの記述子のセットで構成されます。 文書またはレコード内の一部またはすべてのテキストが記述子と一致する場合、その文書またはレコードはカテゴリーと一致します。
テキスト分析ワークベンチで、パターン結果を探索し、それらをカテゴリーの記述子として使用することができます。 テキスト・マイニング・ノードを使用して、テキスト・リンク分析(TLA)の結果を抽出し、データに合わせてテンプレートを微調整することができます。 これらのテンプレートは、後でテキストリンク分析ノードで直接使用することができます。
SPSS Modeler に組み込まれている、意味ネットワークや概念包含などの自動化されたテクニックを使用することで、自動的にカテゴリを構築することができます。 または、データに関してあなたが持っているかもしれない他の洞察を使用して手動でカテゴリを作成することができます。 両方の組み合わせを使用することも、テキスト分析パッケージから事前に作成されたカテゴリーのセットをロードすることもできます。
リソースエディタ タブで行うことができます。
カテゴリー・ペイン
「カテゴリー」 ペインで作成したすべてのカテゴリーを管理できます。 グループ化したいコンセプトやパターンに対してカテゴリーが存在しない場合は、新しいカテゴリーを作成することができます。 また、特定のコンセプトやパターンを含めたり除外したりしたい場合は、カテゴリーを絞り込むこともできる。 ペイン内の行を選択すると、対応する文書や記述子の情報が表示されます。
検索アイコンをクリックすると、カテゴリー内の特定のキーワードを検索できます。
カテゴリーの構築方法を変更するには、カテゴリーが選択されていない状態で、ツールバーから設定オプションを参照してください。
を選択します。 設定の詳細については、プレビュー・ペイン
行を選択すると、選択したコンセプトを持つドキュメントまたはレコードのテキストが 「プレビュー」 ペインに表示されます。 テキストは強調表示され、テキスト内で簡単に識別できるようになっています。
「記述子」ペイン
「記述子」 ペインには、コンセプト、タイプ、タイプ・パターン、およびコンセプト・パターンのリストが表示されます。 これらの記述子のいずれかがカテゴリーの一部であるかどうかを確認することもできます。
「カテゴリー」タブの検索
特定のセクションで情報を素早く見つけるには、以下のようにします。
- 「カテゴリー」 タブの 「検索」 アイコンをクリックして、検索フィールドを表示します。
- 検索する単語の文字列を入力します。 上矢印ボタンと下矢印ボタンを使用して、検索の方向を制御できます。 一致するものが見つかると、テキストが強調表示されます。
- 次の一致を検索するには、矢印ボタンをもう一度クリックします。
カスタム・カテゴリー・セット
カテゴリー・セットは .xslx ファイルとしてダウンロードできます。 「カテゴリー」 タブで .xslx ファイルをアップロードすることにより、カテゴリー・セットをカスタマイズして再利用することができます。