資料の 英語版 に戻る言語リソース
SPSS Modelerfor Text Analyticsで使用される言語リソース
最終更新: 2024年12月12日
SPSS Modelerは、言語リソースに依存する抽出プロセスを使用します。 これらの言語資源は、テキストデータをどのように処理し、情報を抽出して概念、タイプ、時にはパターンを得るかの基礎となる。
言語資源はさまざまなタイプに分けられる:
- カテゴリー セット
- カテゴリーとは、テキストデータがスコアリングプロセスを通じて割り当てられる、密接に関連したアイデアやパターンのグループである。
- ライブラリー
- ライブラリーは、TAP とテンプレートの両方のビルディング・ブロックとして使用されます。 各ライブラリは複数の辞書で構成され、用語、類義語、除外リストの定義と管理に使用される。 ライブラリーは個別に提供されていますが、テンプレートおよび TAP と一緒にパッケージ化されています。
- テンプレート
- テンプレートは、一連のライブラリと、いくつかの高度な言語的・非言語的リソースで構成されている。 これらのリソースは、製品の意見など、特定のドメインやコンテキストに適応した専門的なセットを形成する。
- テキスト分析パッケージ(TAP)
- テキスト分析パッケージは、1つまたは複数のカテゴリーセットとバンドルされた定義済みテンプレートです。 TAPはこれらのリソースを束ねて、カテゴリーとその生成に使われたリソースを一緒に保存し、再利用できるようにする。 その後、TAPを再利用して、同じカテゴリーとリソースを他のフローに適用することができる。
注:抽出の際、コンパイルされた内部言語リソースも使用されます。 これらのコンパイルされたリソースには、Coreライブラリの型を補完する多くの定義が含まれている。 これらのコンパイル済み辞書は編集できません。
カスタム言語リソース
SPSS Modelerには、専門的な言語リソースのデフォルトセットがあります。 これらの言語リソースを利用することで、特定の言語や特定のアプリケーションのための研究や微調整の恩恵を受けることができます。 しかし、これらの言語リソースは、あなたのコンテキストやデータに最適化されていないかもしれない。 これらの言語リソースを編集し、変更を保存することで、フローに最適な抽出処理を行うことができます。
また、組織のデータに合わせて独自に微調整されたカスタム言語リソースを作成し、インポートすることもできます。 ローカルファイルを使用して、ユーザーやプロジェクト間で言語リソースを共有することができます。 テンプレート、ライブラリ、TAPをローカルファイルからプロジェクトアセットとして追加できます。