L'analyse des liens textuels (TLA) est une technologie de recherche de modèles. qui identifie les relations entre les concepts extraits des données textuelles sur la base de modèles connus. SPSS Modeler compare les concepts extraits aux règles TLA pour voir si les concepts correspondent aux modèles spécifiques définis dans les règles TLA.
Dans l'onglet Liens de texte, vous pouvez définir de nouvelles règles et explorer les liens de texte et les modèles trouvés dans vos données textuelles. Ces termes sont définis comme suit.
- Modèles
- Un motif est créé en combinant des concepts ou des types. Les motifs peuvent être des motifs de concept ou des motifs de type. Chaque modèle peut comporter jusqu'à six concepts ou six types. Les motifs sont parfois appelés motifs d'analyse des liens du texte (TLA).
- Patrons de types
- Les modèles sont présentés sous forme de combinaisons de mots entre crochets :
<Organization> + <Location> + <Positive>
- Patrons de concepts
- Les schémas conceptuels apparaissent comme des combinaisons de mots sans parenthèses :
atmosphere + pleasant + hotel
Les modèles sont particulièrement utiles lorsque vous souhaitez découvrir des opinions sur un sujet particulier ou des relations entre des concepts.
Par exemple, l'extraction d'un nom de produit à partir d'une revue client peut ne pas vous intéresser. En revanche, vous pouvez examiner les modèles extraits pour voir si vous pouvez trouver des exemples où un document ou un enregistrement exprime une opinion sur le fait que le produit est bon, mauvais ou cher. Vous pouvez également extraire des opinions sur des produits à partir de données d'enquête, ou des relations entre des personnes ou des lieux à partir de données de renseignement.
- règles
- Les règles définissent des modèles de type. L'analyse des liens textuels compare les données textuelles à ces règles au cours de la phase de mise en correspondance du processus d'extraction. Lorsque le texte correspond à un modèle de type, l'information est extraite sous la forme d'un modèle. Ces règles sont définies dans les ressources linguistiques, telles qu'un modèle ou un pack d'analyse de texte (TAP). Les règles sont parfois appelées règles d'analyse des liens du texte (TLA) ou règles de motifs TLA.
- Liens texte
- Les liens de texte indiquent où apparaît un concept ou un modèle dans les données texte.
Pour utiliser le TLA, vous devez disposer de ressources linguistiques contenant un modèle avec certaines règles TLA définies. Lorsque vous sélectionnez un modèle, vous pouvez identifier les modèles dotés de règles par la présence d'une icône dans la colonne TLA.
La façon dont la règle est définie dans les ressources linguistiques détermine la complexité des résultats. Vous pouvez affiner les règles pour les adapter à vos besoins spécifiques dans l'onglet Editeur de ressources . Après avoir exploré les modèles, vous pouvez les ajouter à des catégories.
Panneau de modèle de type
Vous pouvez explorer et sélectionner des modèles à partir de vos résultats d'extraction grâce au volet Type de modèle. Les modèles sont d'abord regroupés en modèles de type, qui sont des combinaisons de types associés qui correspondent à une règle. Cependant, parfois, un seul type correspond à une règle. Les schémas conceptuels sont ensuite regroupés sous les schémas types auxquels ils correspondent. Par exemple, les modèles de concept price + high
et cost + too much
peuvent être regroupés sous le modèle de type <Budget> + <Negative>
. Chaque motif de type peut comporter un nombre quelconque de motifs de concept.
Vous pouvez cliquer sur l'icône Filtre pour filtrer les modèles de types affichés ou rechercher des concepts spécifiques en cliquant sur l'icône Recherche.
Pour modifier le mode d'extraction des motifs, cliquez sur l'icône Réglages alors qu'aucun type de motif n'est sélectionné. Pour plus d'informations sur les réglages, voir Options de réglage.
Panneau d'aperçu
Si vous souhaitez voir comment un motif apparaît dans le document qui le contient, sélectionnez un motif dans le volet Type de motif. Le volet Preview est mis à jour pour l'afficher. Les concepts sont mis en évidence pour vous aider à les identifier facilement dans le texte.
Sous-fenêtre Catégories
La sous-fenêtre Catégories affiche la structure de votre modèle de catégories. La hiérarchie montre comment les modèles sont catégorisés. Le volet Catégories présente les modèles de type dans votre modèle de catégorie et les règles utilisées pour catégoriser les modèles de concept. Tous les motifs de concept qui ont été ajoutés à votre modèle de catégorie apparaissent sous forme de liens de texte.