Nel Text Analytics Workbench, è possibile utilizzare la scheda Concetti per esplorare i concetti e mettere a punto i risultati dell'estrazione.
Quando si esegue il nodo estrazione testo, il motore di estrazione legge i dati di testo, identifica i concetti rilevanti e assegna un tipo a ciascuno. È possibile visualizzare i concetti e i tipi estratti nella scheda Concetti . I concetti possono fornire un'idea dei principali temi nei dati di testo e negli argomenti più importanti.
Nella scheda Concetti si possono vedere i concetti estratti dai dati di testo e i relativi termini e tipi. Questi termini tecnici sono definiti come segue.
- Concetti
- I concetti sono parole e frasi importanti che sono state identificate ed estratte dai dati di testo. Vengono anche indicati come risultati di estrazione. Questi concetti sono raggruppati in tipi. È possibile utilizzare questi concetti per esplorare i dati e creare le categorie.
- Termini
- I termini sono le parole specifiche che costituiscono un concetto. I termini sono parole singole come
airport
olocation
e frasi di parole comeairport pick-up
. Vengono utilizzati per identificare i concetti nel testo. I termini possono essere forme plurali o singolari di parole, parti di parole più grandi, sinonimi o variazioni ortografiche. - Tipi
- I tipi sono raggruppamenti semantici per concetti. Quando vengono estratti i concetti, vengono assegnati ad un
tipo per contribuire a raggruppare concetti simili. Ad esempio, alcuni dei tipi predefiniti sono
<Location>
,<Organization>
,<Person>
,<Positive>
e<Negative>
.
È possibile perfezionare i risultati dell'estrazione modificando le risorse linguistiche. Per semplificare il processo di ottimizzazione delle risorse linguistiche, è possibile eseguire attività di dizionario comuni direttamente dalla scheda Concetti . È possibile ottimizzare altre risorse linguistiche nella scheda Editor risorse .
Riquadro Concetti
Quest' area presenta i risultati dell'estrazione. I concetti e i tipi vengono visualizzati con la codifica dei colori. È possibile fare clic sull'icona Filtro per filtrare i concetti visualizzati o cercare concetti specifici facendo clic sull'icona Ricerca.
Quando si seleziona una riga (un concetto) nel riquadro, è possibile visualizzare le informazioni sui documenti e i record corrispondenti nel riquadro Anteprima .
Per visualizzare i termini sottostanti per un concetto, fare clic sul concetto nel pannello Concetti , quindi fare clic sul menu di overflow e selezionare Mostra termini sottostanti. Non tutti i concetti sono termini sottostanti. Ad esempio, car
manufacturing
e manufacturing of cars
sono sinonimi, ma car manufacturing
è stato estratto come concetto con manufacturing
of cars
come termine sottostante. Se si vuole usare uno di questi concetti come descrittore per una categoria, il termine migliore da usare è car manufacturing
perché corrisponde anche a documenti o record con manufacturing of
cars
.
Per modificare la modalità di estrazione dei concetti, fare clic sull'icona Impostazioni senza alcun concetto selezionato. Per ulteriori informazioni sulle impostazioni, vedere Opzioni di impostazione.
Riquadro di anteprima
Quando si seleziona un concetto, il riquadro Anteprima mostra il testo dei documenti o dei record che hanno il concetto. I concetti sono evidenziati per facilitare l'identificazione nel testo. Quando si passa con il mouse sulle parole codificate per colore, viene visualizzato un suggerimento. Mostra il nome del concetto sotto il quale la parola è stata estratta e il tipo a cui è stata assegnata.