Dans l'atelier d'analyse de texte, vous pouvez utiliser l'onglet Concepts pour explorer les concepts et affiner les résultats de l'extraction.
Lorsque vous exécutez le noeud Text Mining, le moteur d'extraction lit les données textuelles, identifie les concepts pertinents et affecte un type à chacun d'eux. Vous pouvez voir quels concepts et types ont été extraits dans l'onglet Concepts . Les concepts peuvent vous donner une idée des principaux thèmes des données textuelles et des sujets les plus importants.
Dans l'onglet Concepts, vous pouvez voir les concepts qui ont été extraits de vos données textuelles et les termes et types associés. Ces termes techniques sont définis comme suit.
- Concepts
- Les concepts sont des mots et des phrases importants qui ont été identifiés et extraits de vos données textuelles. Ils sont également appelés résultats d'extraction. Ces concepts sont regroupés en types. Vous pouvez utiliser ces concepts pour explorer vos données et créer vos catégories.
- Termes
- Les termes sont les mots spécifiques qui composent un concept. Les termes sont des mots uniques tels que
airport
oulocation
et des phrases telles queairport pick-up
. Ils sont utilisés pour identifier les concepts dans le texte. Les termes peuvent être des formes plurielles ou singulières de mots, des parties de mots plus grands, des synonymes ou des variations orthographiques. - Types
- Les types sont des regroupements sémantiques de concepts. Quand les concepts sont extraits, un type leur est affecté pour regrouper les concepts similaires. Par exemple, certains des types par défaut sont
<Location>
,<Organization>
,<Person>
,<Positive>
et<Negative>
.
Vous pouvez affiner les résultats de l'extraction en modifiant les ressources linguistiques. Pour simplifier le processus d'optimisation de vos ressources linguistiques, vous pouvez effectuer des tâches de dictionnaire courantes directement à partir de l'onglet Concepts . Vous pouvez optimiser d'autres ressources linguistiques dans l'onglet Editeur de ressources .
Sous-fenêtre Concepts
Cette zone présente les résultats de l'extraction. Les concepts et les types apparaissent avec un codage par couleur. Vous pouvez cliquer sur l'icône Filtre pour filtrer les concepts affichés ou rechercher des concepts spécifiques en cliquant sur l'icône Recherche.
Lorsque vous sélectionnez une ligne (un concept) dans la sous-fenêtre, vous pouvez voir des informations sur les documents et enregistrements correspondants dans la sous-fenêtre Aperçu .
Pour voir les termes sous-jacents d'un concept, cliquez sur le concept dans la sous-fenêtre Concepts , puis cliquez sur le menu déroulant dynamique et sélectionnez Afficher les termes sous-jacents. Les concepts ne possèdent pas tous des termes sous-jacents. Par exemple, car
manufacturing
et manufacturing of cars
sont synonymes, mais car manufacturing
a été extrait en tant que concept avec manufacturing
of cars
comme terme sous-jacent. Si vous souhaitez utiliser l'un de ces concepts comme descripteur d'une catégorie, le meilleur terme à utiliser est car manufacturing
car il correspond également à des documents ou à des enregistrements avec manufacturing of
cars
.
Pour modifier le mode d'extraction des concepts, cliquez sur l'icône Réglages alors qu'aucun concept n'est sélectionné. Pour plus d'informations sur les réglages, voir Options de réglage.
Panneau d'aperçu
Lorsque vous sélectionnez un concept, la sous-fenêtre Aperçu affiche le texte des documents ou des enregistrements contenant le concept. Les concepts sont mis en évidence pour vous aider à les identifier facilement dans le texte. Lorsque vous survolez les mots codés par couleur, une infobulle s'affiche. Il indique le nom du concept sous lequel le mot a été extrait et le type auquel il a été affecté.