Dopo che SPSS Modeler ha estratto i concetti e i tipi dai dati di testo, si può iniziare a costruire le categorie. In Text Analytics Workbench è possibile utilizzare la scheda Categorie per creare ed esplorare le categorie.
Nella scheda Categorie, è possibile creare categorie utilizzando i descrittori. Questi termini sono definiti come segue.
- Categorie
- Le categorie sono un gruppo di idee e modelli strettamente correlati a cui vengono assegnati documenti e record tramite un processo di calcolo del punteggio. Organizzano i concetti e i modelli correlati in raggruppamenti più ampi, che sono più semplici da gestire. Le categorie sono una combinazione di concetti, tipi, regole e pattern.
- Descrittori
- I descrittori vengono utilizzati per identificare se un record o un documento appartiene a una categoria. Ogni categoria è composta da un insieme di descrittori, quali concetti, tipi e regole. Quando parte o tutto il testo di un documento o di un record corrisponde a un descrittore, il documento o il record corrispondono alla categoria.
Nel workbench di Text Analytics, è possibile esplorare i risultati del modello e utilizzarli come descrittori per le categorie. È possibile utilizzare il nodo Text Mining per estrarre i risultati dell'analisi dei collegamenti testuali (TLA) come metodo per affinare i modelli ai propri dati. Questi modelli possono essere utilizzati in seguito direttamente nel nodo Analisi dei collegamenti testuali.
È possibile creare automaticamente le categorie utilizzando le tecniche automatizzate integrate in SPSS Modeler, come le reti semantiche e l'inclusione di concetti. In alternativa, è possibile creare manualmente delle categorie utilizzando altre informazioni che si possono avere sui dati. È anche possibile utilizzare una combinazione di entrambi e caricare una serie di categorie precompilate da un pacchetto di analisi del testo.
È possibile perfezionare i risultati dell'estrazione modificando le risorse linguistiche, come si può fare nella scheda Resource editor.
Riquadro Categorie
È possibile gestire qualsiasi categoria creata nel riquadro Categorie . È possibile creare nuove categorie se non esistono categorie per i concetti e i modelli che si desidera raggruppare. È inoltre possibile affinare una categoria se si desidera che includa o escluda concetti o modelli specifici. È possibile selezionare una riga nel riquadro per visualizzare le informazioni relative ai documenti o ai descrittori corrispondenti.
È possibile cercare parole chiave specifiche nelle categorie facendo clic sull'icona Cerca.
Per modificare la modalità di creazione delle categorie, selezionare Opzioni di impostazione.
dalla barra degli strumenti quando non è selezionata alcuna categoria. Per ulteriori informazioni sulle impostazioni, vedereRiquadro di anteprima
Quando si seleziona una riga, il riquadro Anteprima mostra il testo dei documenti o dei record che hanno il concetto selezionato. Il testo viene evidenziato per facilitare l'identificazione nel testo.
Riquadro Descrittori
Il riquadro Descrittori mostra un elenco di concetti, tipi, modelli di tipo e modelli di concetto. È anche possibile vedere se uno di questi descrittori fa parte di una categoria.
Ricerca nella scheda Categorie
Per individuare rapidamente le informazioni in una particolare sezione:
- Fare clic su Trova nella scheda Categorie per visualizzare il campo di ricerca.
- Immettere la stringa di parole che si desidera ricercare. È possibile utilizzare i pulsanti freccia su e giù per controllare la direzione della ricerca. Se viene trovata una corrispondenza, il testo viene evidenziato.
- Per cercare la corrispondenza successiva, fare nuovamente clic sul pulsante freccia.
Serie di categorie personalizzate
È possibile scaricare una serie di categorie come file .xslx . È possibile personalizzare la serie di categorie e riutilizzarla caricando il file .xslx nella scheda Categorie .