0 / 0
Retourner à la version anglaise de la documentation
onglet Concepts
Dernière mise à jour : 24 sept. 2024
Onglet Concepts (SPSS Modeler)

Dans l'atelier d'analyse de texte, vous pouvez utiliser l'onglet Concepts pour explorer les concepts et affiner les résultats de l'extraction.

Lorsque vous exécutez le noeud Text Mining, le moteur d'extraction lit les données textuelles, identifie les concepts pertinents et affecte un type à chacun d'eux. Vous pouvez voir quels concepts et types ont été extraits dans l'onglet Concepts . Les concepts peuvent vous donner une idée des principaux thèmes des données textuelles et des sujets les plus importants.

Dans l'onglet Concepts, vous pouvez voir les concepts qui ont été extraits de vos données textuelles et les termes et types associés. Ces termes techniques sont définis comme suit.

Concepts
Les concepts sont des mots et des phrases importants qui ont été identifiés et extraits de vos données textuelles. Ils sont également appelés résultats d'extraction. Ces concepts sont regroupés en types. Vous pouvez utiliser ces concepts pour explorer vos données et créer vos catégories.
Termes
Les termes sont les mots spécifiques qui composent un concept. Les termes sont des mots uniques tels que airport ou location et des phrases telles que airport pick-up. Ils sont utilisés pour identifier les concepts dans le texte. Les termes peuvent être des formes plurielles ou singulières de mots, des parties de mots plus grands, des synonymes ou des variations orthographiques.
Types
Les types sont des regroupements sémantiques de concepts. Quand les concepts sont extraits, un type leur est affecté pour regrouper les concepts similaires. Par exemple, certains des types par défaut sont <Location>, <Organization>, <Person>, <Positive>et <Negative>.
Figure 1 : onglet Concepts
onglet Concepts

Vous pouvez affiner les résultats de l'extraction en modifiant les ressources linguistiques. Pour simplifier le processus d'optimisation de vos ressources linguistiques, vous pouvez effectuer des tâches de dictionnaire courantes directement à partir de l'onglet Concepts . Vous pouvez optimiser d'autres ressources linguistiques dans l'onglet Editeur de ressources .

Sous-fenêtre Concepts

Cette zone présente les résultats de l'extraction. Les concepts et les types apparaissent avec un codage par couleur. Vous pouvez cliquer sur l'icône Filtre pour filtrer les concepts affichés ou rechercher des concepts spécifiques en cliquant sur l'icône Recherche.

Lorsque vous sélectionnez une ligne (un concept) dans la sous-fenêtre, vous pouvez voir des informations sur les documents et enregistrements correspondants dans la sous-fenêtre Aperçu .

Remarque: si vous sélectionnez plus de 100 concepts, la liste complète des documents s'affiche.

Pour voir les termes sous-jacents d'un concept, cliquez sur le concept dans la sous-fenêtre Concepts , puis cliquez sur le menu déroulant dynamique et sélectionnez Afficher les termes sous-jacents. Les concepts ne possèdent pas tous des termes sous-jacents. Par exemple, car manufacturing et manufacturing of cars sont synonymes, mais car manufacturing a été extrait en tant que concept avec manufacturing of cars comme terme sous-jacent. Si vous souhaitez utiliser l'un de ces concepts comme descripteur d'une catégorie, le meilleur terme à utiliser est car manufacturing car il correspond également à des documents ou à des enregistrements avec manufacturing of cars.

Pour modifier le mode d'extraction des concepts, cliquez sur l'icône Réglages alors qu'aucun concept n'est sélectionné. Pour plus d'informations sur les réglages, voir Options de réglage.

Panneau d'aperçu

Lorsque vous sélectionnez un concept, la sous-fenêtre Aperçu affiche le texte des documents ou des enregistrements contenant le concept. Les concepts sont mis en évidence pour vous aider à les identifier facilement dans le texte. Lorsque vous survolez les mots codés par couleur, une infobulle s'affiche. Il indique le nom du concept sous lequel le mot a été extrait et le type auquel il a été affecté.