È possibile creare categorie in base alla tecnica di frequenza diretta e meccanica. Con questa tecnica, è possibile creare una categoria per ogni elemento (tipo, concetto o modello) che è stato trovato superiore a un determinato conteggio di record o documenti. Inoltre, è possibile creare una singola categoria per tutti gli elementi che ricorrono meno frequentemente. Per il conteggio, si fa riferimento al numero di record contenenti il concetto (e tutti i suoi sinonimi), il tipo o il pattern estratti, in opposizione al numero totale di ricorrenze nell'intero testo.
Il raggruppamento di elementi ricorrenti frequentemente può produrre risultati interessanti, perché potrebbe indicare una risposta comune o importante. La tecnica è molto utile sui risultati di estrazione non utilizzati dopo aver applicato altre tecniche. Un'altra applicazione deve eseguire questa tecnica immediatamente dopo l'estrazione quando non esistono altre categorie, modificare i risultati per eliminare categorie non rilevanti e quindi estendere tali categorie in modo che corrispondano ad ancora più record o documenti.
Invece di utilizzare questa tecnica, è possibile ordinare i concetti o i modelli di concetto in base al numero decrescente di record o documenti nel riquadro dei risultati di estrazione e quindi trascinare e rilasciare quelli con il maggior numero di record nel riquadro delle categorie per creare le categorie corrispondenti.
Le seguenti impostazioni avanzate sono disponibili per l'opzione Utilizza le frequenze per creare categorie nelle impostazioni di categoria.
- Livello concetti. Selezionando questa opzione verranno utilizzate concetti o frequenze di pattern di concetti. Verranno utilizzati i concetti se sono stati selezionati i tipi come input per la creazione di categorie e verranno utilizzati i pattern di concetto se sono stati selezionati i pattern di tipo. In generale, applicando questa tecnica a livello di concetto si produrranno risultati più specifici, poiché i concetti e i pattern di concetto rappresentano un livello inferiore di misurazione.
- Livello tipi. Selezionando questa opzione verranno utilizzate le frequenze di pattern di tipo. Verranno utilizzati i tipi se erano stati selezionati i tipi come input per la creazione di categorie e i pattern di tipo se erano stati selezionati i pattern di tipo. Applicando questa tecnica a livello di tipo, è possibile ottenere una vista rapida del tipo di informazioni fornite.
Numero minimo di record/documenti per elementi che hanno una propria categoria. Con questa opzione, è possibile creare categorie da elementi che ricorrono spesso. Questa opzione limita l'output a quelle categorie che contengono un descrittore che era presente in almeno un numero X di record o documenti, dove X è il valore da immettere per questa opzione.
Raggruppa tutti gli elementi rimanenti in una categoria denominata. Utilizzare questa opzione se si desidera raggruppare tutti i concetti o i tipi che ricorrono poco spesso in un'unica categoria complessiva con un nome a scelta. Per impostazione predefinita, questa categoria è denominata Altro.
- Risultati dell'estrazione non utilizzati. Questa opzione consente di creare categorie dai risultati dell'estrazione che non sono utilizzati in nessuna categoria esistente. Ciò riduce al minimo la tendenza dei record a corrispondere a più categorie e limita il numero di categorie prodotte.
- Tutti i risultati dell'estrazione. Questa opzione consente di creare le categorie utilizzando uno qualsiasi dei risultati dell'estrazione. Questo è particolarmente utile quando non esistono già categorie o esistono poche categorie.
Modifica i nomi di categoria duplicati per. Selezionare la modalità di gestione di eventuali nuove categorie o sottocategorie i cui nomi sono gli stessi di categorie esistenti. È possibile unire le nuove categorie (e i relativi descrittori) con le categorie esistenti con lo stesso nome oppure è possibile scegliere di ignorare la creazione di qualsiasi categoria se si trova un nome duplicato nelle categorie esistenti.