SPSS Modeler utilise un processus d'extraction qui s'appuie sur des ressources linguistiques. Ces ressources linguistiques servent de base au traitement des données textuelles et à l'extraction d'informations pour obtenir des concepts, des types et parfois des modèles.
Les ressources linguistiques peuvent être divisées en différents types :
- Ensembles de catégories
- Les catégories sont un groupe d'idées et de modèles étroitement liés auxquels les données textuelles sont attribuées par le biais d'un processus de notation.
- Bibliothèques
- Les bibliothèques sont utilisées comme blocs de construction pour les TAP et les modèles. Chaque bibliothèque est composée de plusieurs dictionnaires, qui servent à définir et à gérer les termes, les synonymes et les listes d'exclusion. Alors que les bibliothèques sont également fournies individuellement, elles sont prégroupées dans les modèles et les TAP.
- Modèles
- Les modèles consistent en un ensemble de bibliothèques et de ressources linguistiques et non linguistiques avancées. Ces ressources forment un ensemble spécialisé adapté à un domaine ou à un contexte particulier, comme les avis sur les produits.
- Logiciels d'analyse de texte (TAP)
- Un paquet d'analyse de texte est un modèle prédéfini qui est associé à un ou plusieurs ensembles de catégories. Les PAT regroupent ces ressources de manière à ce que les catégories et les ressources utilisées pour les générer soient à la fois stockées ensemble et réutilisables. Vous pouvez ensuite réutiliser un PAT pour appliquer les mêmes catégories et ressources à d'autres flux.
Ressources linguistiques personnalisées
SPSS Modeler dispose d'un ensemble de ressources linguistiques spécialisées par défaut. Vous pouvez utiliser ces ressources linguistiques pour bénéficier de la recherche et de la mise au point de langues et d'applications spécifiques. Cependant, ces ressources linguistiques peuvent ne pas être optimisées pour votre contexte ou vos données. Vous pouvez éditer et enregistrer les modifications apportées à ces ressources linguistiques afin d'optimiser le processus d'extraction pour votre flux.
Vous pouvez également créer et importer des ressources linguistiques personnalisées adaptées aux données de votre organisation. Vous pouvez utiliser des fichiers locaux pour partager ces ressources linguistiques entre les utilisateurs et les projets. Vous pouvez ajouter un modèle, une bibliothèque ou un TAP en tant que ressource de projet à partir d'un fichier local.