L'analisi dei link testuali (TLA) è una tecnologia di pattern-matching. che identifica le relazioni tra i concetti estratti nei dati di testo sulla base di modelli noti. SPSS Modeler confronta i concetti estratti con le regole TLA per verificare se i concetti corrispondono ai modelli specifici definiti nelle regole TLA.
Nella scheda Collegamenti testuali è possibile definire nuove regole ed esplorare i collegamenti testuali e i modelli presenti nei dati di testo. Questi termini sono definiti come segue.
- Pattern
- Un pattern viene creato combinando concetti o tipi. I modelli possono essere modelli di concetto o modelli di tipi. Ogni schema può avere fino a sei concetti o sei tipi. I modelli sono a volte indicati come modelli TLA (text link analysis).
- Pattern tipi
- I modelli di tipo sono indicati come combinazioni di parole tra parentesi angolari:
<Organization> + <Location> + <Positive>
- Pattern concetti
- I modelli concettuali appaiono come combinazioni di parole senza parentesi:
atmosphere + pleasant + hotel
I modelli sono molto utili quando si vogliono scoprire opinioni su un particolare argomento o relazioni tra concetti.
Ad esempio, l'estrazione di un nome prodotto da una recensione del cliente potrebbe non interessarti. Si possono invece esaminare i modelli estratti per vedere se si possono trovare esempi in cui un documento o un record esprime un'opinione sul fatto che il prodotto è buono, cattivo o costoso. Potreste anche voler estrarre le opinioni sui prodotti dai dati dei sondaggi o le relazioni tra persone o luoghi dai dati di intelligence.
- Regole
- Le regole definiscono i pattern tipo. L'analisi dei collegamenti testuali confronta i dati testuali con queste regole durante la fase di pattern matching del processo di estrazione. Quando il testo corrisponde a un modello di tipo, l'informazione viene estratta come modello. Queste regole sono definite nelle risorse linguistiche, come un modello o un pacchetto di analisi del testo (TAP). Le regole sono a volte indicate come regole TLA (text link analysis) o regole di modello TLA.
- Link di testo
- I link di testo mostrano dove nei dati di testo viene visualizzato un concetto o un pattern.
Per utilizzare il TLA, è necessario disporre di risorse linguistiche che contengano un modello con alcune regole TLA definite. Quando si seleziona un modello, è possibile identificare i modelli con regole in base alla presenza di un'icona nella colonna TLA.
Il modo in cui la regola del modello è definita nelle risorse linguistiche determina la complessità dei risultati del modello. È possibile perfezionare le regole per adattarle alle specifiche esigenze nella scheda Editor risorse . Dopo aver esplorato i modelli, è possibile aggiungerli alle categorie.
Riquadro Modello tipo
È possibile esplorare e selezionare i modelli dai risultati dell'estrazione con il riquadro Tipo di modello. I modelli vengono prima raggruppati in modelli tipo, che sono combinazioni di tipi correlati che corrispondono a una regola. Tuttavia, a volte un singolo tipo corrisponde a una regola. I modelli concettuali vengono poi raggruppati in base ai modelli di tipo a cui si adattano. Ad esempio, i pattern di concetto price + high
e cost + too much
potrebbero essere raggruppati sotto il pattern di tipo <Budget> + <Negative>
. Ogni modello di tipo può avere un qualsiasi numero di modelli di concetto al di sotto di esso.
È possibile fare clic sull'icona Filtro per filtrare i modelli di tipo visualizzati o cercare concetti specifici facendo clic sull'icona Ricerca.
Per modificare la modalità di estrazione dei modelli, fare clic sull'icona Impostazioni quando non è selezionato alcun modello di tipo. Per ulteriori informazioni sulle impostazioni, vedere Opzioni di impostazione.
Riquadro di anteprima
Se si desidera vedere come appare un modello nel documento che lo contiene, selezionare un modello nel riquadro Tipo di modello. Il riquadro Anteprima si aggiorna per mostrarlo. I concetti sono evidenziati per facilitare l'identificazione nel testo.
Riquadro Categorie
Il riquadro Categorie mostra la struttura del modello di categorie. La gerarchia mostra come vengono categorizzati i modelli. Il riquadro Categorie mostra i modelli di tipo nel modello di categoria e le regole utilizzate per categorizzare i modelli di concetto. Tutti i modelli di concetto che sono stati aggiunti al modello di categoria vengono visualizzati come collegamenti di testo.