資料の 英語版 に戻るソース・テキストの読み取り
ソース・テキストでの読み取り (SPSS Modeler)
最終更新: 2024年10月04日
言語識別子ノードを使用して、ソース・データ内のテキスト・フィールドの自然言語を識別することができます。 このノードの出力は、検出された言語コードを含む派生フィールドです。
テキストマイニング用のデータは、 SPSS Modeler フローで使用される標準形式のいずれかにすることができます。これには、行と列のデータを表すデータベースやその他の「長方形」形式が含まれます。
- SPSS Modeler フローで使用される標準データ形式 (顧客コメント用の 1 つ以上のテキスト・フィールドを持つデータベースなど) のいずれかからテキストを読み込むには、インポート・ノードを使用できます。
- 大量のデータ (複数の異なる言語で記述されたテキストが含まれているデータなど) を処理する場合は、言語識別子ノードを使用して、特定のフィールドで使用されている言語を識別します。