Vous pouvez créer des catégories en fonction d'une technique de fréquence simple et mécanique. Avec cette technique, vous pouvez créer une catégorie pour chaque élément (type, concept ou motif) dont la valeur est supérieure à un nombre d'enregistrements ou de documents donné. Vous pouvez également créer une catégorie regroupant tous les termes moins fréquents. Les effectifs désignent le nombre d'enregistrements ou de documents contenant le concept extrait (et tous ses synonymes), le type ou le motif dans la question par rapport au nombre total d'occurrences d'un concept, d'un type ou d'un motif dans l'ensemble du texte.
Le regroupement d'éléments fréquents peut produire des résultats intéressants, car il peut indiquer une réponse courante ou importante. Cette technique est très efficace si elle a été exécutée sur les résultats d'extraction inutilisés après que d'autres techniques ont été appliquées. Une autre application consiste à exécuter cette technique immédiatement après l'extraction lorsqu'aucune autre catégorie n'existe, éditer les résultats pour supprimer les catégories sans intérêt, puis étendre ces catégories afin de leur faire correspondre toujours plus d'enregistrements ou de documents.
Au lieu d'utiliser cette technique, vous pouvez trier les concepts ou les motifs de concept par nombre décroissant d'enregistrements ou de documents dans la sous-fenêtre des résultats d'extraction, puis faire glisser et déposer ceux qui contiennent le plus d'enregistrements dans la sous-fenêtre des catégories pour créer les catégories correspondantes.
Les paramètres avancés suivants sont disponibles pour l'option Utiliser les fréquences pour créer des catégories dans les paramètres de catégorie.
- Niveau des concepts. Le fait de sélectionner cette option signifie que les fréquences de concepts ou de motifs de concept seront utilisées. Les concepts sont utilisés si les types ont été sélectionnés comme entrée pour la génération de catégorie et les motifs de concept sont utilisés si les motifs de type ont été sélectionnés. En général, appliquer cette technique au niveau du concept produira des résultats plus précis car les concepts et motifs de concept représentent un niveau de mesure moins élevé.
- Niveau des types. Le fait de sélectionner cette option signifie que les fréquences de types ou de motifs de type seront utilisées. Les types sont utilisés si les types ont été sélectionnés comme entrée pour la génération de catégorie et les motifs de type sont utilisés si les motifs de type ont été sélectionnés. En appliquant cette technique au niveau du type, vous pouvez obtenir un aperçu rapide du type d'informations fournies.
Effectif minimal d'enregistrements/documents pour que les articles aient leur propre catégorie. Avec cette option, vous pouvez créer des catégories à partir d'éléments fréquents. Cette option restreint la sortie aux seules catégories contenant un descripteur qui s'est produit dans au moins un nombre X d'enregistrements ou de documents, où X est la valeur à entrer pour cette option.
Regrouper tous les éléments restants dans une catégorie nommée. Utilisez cette option si vous voulez regrouper tous les concepts ou types qui se produisent rarement dans une seule catégorie de fourre-tout avec le nom de votre choix. Par défaut, cette catégorie est appelée Autre.
- Résultats d'extraction non utilisés. Cette option permet de construire des catégories à partir de résultats d'extraction qui ne sont pas utilisés dans des catégories existantes. Ceci réduit la tendance des enregistrements à correspondre à plusieurs catégories et limite le nombre de catégories produites.
- Tous les résultats d'extraction. Cette option permet aux catégories d'êtres créées à l'aide de tous les résultats d'extraction. Ceci est particulièrement utile quand aucune ou peu de catégories existent déjà.
Résoudre les noms de catégories en double en. Choisissez la manière de manipuler les nouvelles catégories ou sous-catégories dont le nom sera identique dans des catégories existantes. Vous pouvez fusionner les nouvelles catégories (et leurs descripteurs) avec les catégories existantes avec le même nom, ou vous pouvez choisir d'ignorer la création des catégories si un nom en double est trouvé dans les catégories existantes.