0 / 0
Torna alla versione inglese della documentazione
Analizzare il testo per la soddisfazione dell'hotel
Ultimo aggiornamento: 12 dic 2024
Analizzare il testo per la soddisfazione dell'hotel

Questa esercitazione aiuta ad analizzare il testo utilizzando i nodi specializzati nella gestione del testo. Ad esempio, è possibile eseguire l'analisi del sentiment.

In questa esercitazione, un direttore d'albergo vuole analizzare le recensioni dell'hotel per vedere cosa pensano i clienti. Le recensioni esprimono opinioni sul personale dell'hotel, sul comfort, sulla pulizia, sul prezzo e altre aree di interesse.

Figura 1. Grafico delle opinioni positive
Grafico delle opinioni positive. Mostra termini e frasi, come la posizione, il budget e i servizi dell'hotel. Questi termini sono di dimensioni diverse a seconda della loro importanza. Hanno organizzato il termine centrale più importante che è nel centro ed è il più grande.
Figura 2. Grafico delle opinioni negative
Grafico delle opinioni negative. Mostra termini e frasi, come la posizione, il budget e i servizi dell'hotel. Questi termini sono di dimensioni diverse a seconda della loro importanza. Hanno organizzato il termine centrale più importante che è nel centro ed è il più grande.

Prova il tutorial

In questa esercitazione, completerete questi compiti:

Esempio di flusso di modellazione e set di dati

Questa esercitazione utilizza il flusso Hotel Satisfaction nel progetto di esempio. Il flusso utilizza i nodi Text Analytics per analizzare le recensioni fittizie sull'hotel. Il file di dati utilizzato è hotelSatisfaction.csv. L'immagine seguente mostra il flusso del modellatore di esempio.

Flusso completato
L'immagine seguente mostra il set di dati di esempio.
Dataset di esempio

Compito 1: Aprire il progetto di esempio

Il progetto campione contiene diversi set di dati e flussi di modellazione di esempio. Se non si dispone già del progetto di esempio, consultare l'argomento Tutorial per creare il progetto di esempio. Seguite quindi i passaggi seguenti per aprire il progetto campione:

  1. In 'watsonx, dal menu di navigazione 'Menu di navigazione, scegliere Progetti > Visualizza tutti i progetti.
  2. Fare clic su ProgettoSPSS Modeler.
  3. Fare clic sulla scheda Assets per visualizzare i set di dati e i flussi del modellatore.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra la scheda Assets del progetto. Ora si è pronti a lavorare con il flusso del modellatore di esempio associato a questa esercitazione.

alt text

torna all'inizio

Compito 2: Esaminare il nodo Asset di dati

La soddisfazione alberghiera comprende diversi nodi. Per esaminare il nodo Asset di dati, procedere come segue:

  1. Dalla scheda Assets, aprire il flusso del modellatore Hotel Satisfaction e attendere il caricamento dell'area di disegno.
  2. Fare doppio clic sul nodo hotelSatisfaction.csv. Questo nodo è una risorsa dati che punta al file hotelSatisfaction.csv del progetto.
  3. Esaminare il 'Proprietà del formato del file.
  4. Facoltativo: Fare clic su Anteprima dati per visualizzare l'intero set di dati.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il nodo Data Asset. Ora si è pronti a esaminare il nodo Text Mining.

Nodo Filtro

torna all'inizio

Compito 3: Esaminare il nodo Estrazione di testo

Il text mining è un processo iterativo che identifica concetti e modelli rilevanti nei dati di testo. Quando si esegue il nodo Text Mining, il motore di estrazione legge i dati del testo, identifica i concetti rilevanti e assegna un tipo a ciascuno. È quindi possibile rivedere i risultati dell'estrazione utilizzando il Text Analytics Workbench per perfezionare il processo di estrazione. È possibile rieseguire il nodo Text Mining per produrre nuovi risultati e quindi valutare i nuovi risultati. Si noti il nodo Tipo tra il nodo Asset di dati e il nodo Estrazione di testo. Il nodo Tipo è necessario per identificare correttamente i campi del set di dati. Per esaminare il nodo Text mining, procedere come segue:

  1. Fare doppio clic sul nodo Commenti (Text Mining) per visualizzarne le proprietà.
  2. Impostare queste proprietà nella sezione Campi:
    1. Per il campo Testo, selezionare Commenti.
    2. Per il campo ID, selezionare id.
      Nota: solo il campo Testo è obbligatorio.
      Figura 3 Proprietà del nodo Text Mining
      Proprietà di costruzione del nodo Text Mining. Mostra alcune impostazioni di campo nella finestra, come il campo Testo e il campo ID.
  3. Nella sezione Modello, si noti che il pacchetto di analisi del testo selezionato è Soddisfazione alberghiera (inglese)/Topic + Opinione.

    Un pacchetto di analisi testuale (TAP) è un insieme predefinito di librerie e risorse linguistiche e non linguistiche avanzate, che sono abbinate a uno o più gruppi di categorie predefinite. Se nessun pacchetto di analisi del testo è rilevante per la vostra applicazione, potete invece selezionare un modello Resource. Un modello di risorsa è un insieme predefinito di librerie e risorse linguistiche e non linguistiche avanzate che sono state messe a punto per un particolare dominio o utilizzo.

  4. Nella sezione Costruisci modelli, impostare queste proprietà:
    1. Verificare che il campo Modalità di costruzione sia impostato su Costruisci interattivamente (categoria modello nugget). In seguito, quando si esegue il nodo, questa opzione avvia Text Analytics Workbench, un'interfaccia interattiva che consente di esplorare e perfezionare i risultati dell'estrazione.
    2. Verificare che il campo Inizio sessione per sia impostato su Estrazione di concetti e collegamenti di testo. L'opzione Estrazione di concetti estrae solo i concetti, mentre l'estrazione TLA produce sia i concetti sia i collegamenti testuali che sono connessioni tra argomenti (come servizio, personale e cibo) e opinioni.
  5. Espandere la sezione Esperto e verificare che l'opzione Adatta l'ortografia per una parola di lunghezza minima di caratteri sia selezionata con un limite ortografico di '5. Questa opzione applica una tecnica di raggruppamento che consente di raggruppare parole errate o parole simili in un unico concetto. L'algoritmo di raggruppamento fuzzy elimina temporaneamente le consonanti doppie o triple e tutte le vocali (tranne la prima) dalle parole estratte. Poi li confronta per vedere se sono uguali. Ad esempio, " location e " locattoin sono raggruppati.

    Figura 4. Proprietà esperte dei nodi di Text Mining.
    Proprietà esperte dei nodi di Text Mining. Mostra le impostazioni delle proprietà del nodo Text Mining. Alcuni gruppi di impostazioni principali sono Impostazioni, Costruisci modelli ed Esperto. Nel raggruppamento Esperto sono presenti caselle di controllo per impostazioni quali Accorda l'ortografia per un limite minimo di caratteri della radice, Estrai gli unitari, Estrai le entità non linguistiche, Algoritmo maiuscolo, Raggruppa i nomi di persona parziali e completi insieme quando possibile e Usa la derivazione quando raggruppa i sostantivi composti.
  6. Fare clic su Salva.
  7. Passare il mouse sul nodo Commenti (estrazione del testo) e fare clic sull'icona Esegui 'Icona di esecuzione.
  8. Nel riquadro Output e modelli, fare clic sui risultati con il nome Commenti per aprire il Workbench di analisi del testo.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il Workbench di analisi del testo. Ora si è pronti a sintonizzare i risultati.

Workbench di Text Analytics

torna all'inizio

Compito 4: sintonizzare i risultati in Text Analytics Workbench

Il Text Analytics Workbench contiene i risultati dell'estrazione e il modello di categoria contenuto nel pacchetto di analisi del testo. Si tratta di un banco di lavoro interattivo in cui è possibile esplorare e perfezionare i risultati estratti, costruire e perfezionare le categorie e creare nuggets di modelli di categoria. Seguite questi passaggi per sintonizzare i risultati nel Text Analytics Workbench:

Concetti

  1. Fare clic sulla scheda Concetti.

    Durante il processo di estrazione, i dati di testo vengono analizzati per identificare singole parole interessanti o rilevanti, come " airport o " location, e frasi di parole come " airport pick-up. Queste parole e frasi sono collettivamente indicate come termini. Utilizzando le risorse linguistiche, vengono estratti i termini rilevanti e i termini simili vengono raggruppati sotto un termine principale, chiamato concetto.

    In questo modo, un concetto può rappresentare più termini sottostanti. Dipende da come il termine viene usato nel testo e dall'insieme di risorse linguistiche che si stanno utilizzando.

  2. Fare clic sull'icona del filtro " Icona Filtro
  3. È inoltre possibile utilizzare un filtro per selezionare un sottoinsieme di concetti. L'immagine seguente mostra le diverse opzioni:

    Figura 5. Text Analytics Workbench - opzioni di filtro
    Text Analytics Workbench - opzioni di filtro

    Se si desidera rimuovere i filtri e visualizzare tutti i concetti, fare clic su Cancella filtro.

    Fare clic su Annulla per chiudere il riquadro Filtro.

Link di testo

  1. Fare clic sulla scheda Collegamenti di testo.

    L'analisi dei collegamenti testuali (TLA) è una tecnologia di pattern-matching che confronta le regole TLA con i concetti e le relazioni estratte nel testo. Nella scheda Collegamenti di testo è possibile costruire ed esplorare i modelli TLA presenti nei dati di testo.

  2. Selezionare un modello di tipo (ad esempio, <Servizi> + <Positivo> ) per visualizzare un'anteprima del testo nel documento. Se il testo del 'Anteprima del documento è troncato, fare clic sull'icona 'Visualizza l'intero documento e 'Icona di visualizzazione dell'intero documento ' per visualizzare l'intero testo.
    Workbench di analisi del testo - Scheda Collegamenti di testo. Mostra i modelli di tipo nella scheda Collegamento di testo. A lato si trova il riquadro Anteprima, che presenta una tabella con tre colonne. Le tre colonne sono Inserimento, Anteprima documento e Percorso categoria.

Categorie

  1. Fare clic sulla scheda Categorie.

    Potete costruire e gestire le vostre categorie. Una volta estratti i concetti e i tipi dai dati testuali, è possibile iniziare a costruire le categorie automaticamente utilizzando tecniche come l'inclusione di concetti, la rete semantica (solo in inglese) o manualmente.

    Poiché questo flusso di esempio utilizza un modello di pacchetto di analisi del testo, il modello di categoria è già popolato.

  2. Fare clic su Tutti i documenti per assegnare un punteggio ai documenti o alle registrazioni. Ogni volta che una categoria viene creata o aggiornata, è possibile vedere se un testo corrisponde a un descrittore di una categoria specifica. Se viene rilevata una corrispondenza, il documento o il record vengono assegnati a tale categoria. Il risultato è che la maggior parte, se non tutti, i documenti o i record sono assegnati alle categorie in base ai descrittori delle categorie.
  3. Espandere una categoria, ad esempio, Servizi dell'hotel > Pulizia > Neg > non pulito.
  4. Visualizzare i documenti nella scheda Anteprima e nella scheda Descrittori per vedere i dati di origine.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra l'anteprima del documento per la categoria Pulizia. Ora si è pronti a costruire il modello.

Nodo Riempimento

torna all'inizio

Compito 5: costruire il modello

Una volta terminata la messa a punto del processo di estrazione, è possibile generare un modello di categoria a partire dalle personalizzazioni e dalle categorie costruite. Seguite questi passaggi per costruire e distribuire il modello:

  1. Fare clic su Genera un modello per generare un modello di categoria.
    Immagine che mostra il pulsante per generare un modello
  2. Fare clic su Costruisci per confermare la generazione di un modello di categoria.
  3. Quando vedrete il successo! fare clic su Ritorno al flusso.
  4. Fare clic su Salva e esci per salvare le modifiche e il nodo Text Mining nel flusso.
    Il nugget del modello di categoria generato viene visualizzato sul canvas del flusso.
    Figura 6. Nugget del modello di categoria generato
    Nugget del modello di categoria generato. Mostra un flusso con un nodo Text Mining e una pepita del modello di categoria.
  5. Si notino i due nodi del Modello di soddisfazione nel flusso di esempio. Ora che il Text Analytics Workbench ha convalidato e generato un modello di categoria, è possibile distribuirlo nel flusso e assegnare un punteggio allo stesso set di dati o a nuovi dati. Ogni modello utilizza una modalità diversa per l'assegnazione dei punteggi.
    Figura 7. Flusso di esempio con due modalità per il calcolo del punteggio
    Flusso di esempio con due modalità per il calcolo del punteggio
  6. Fare doppio clic sul primo nodo del modello di soddisfazione.
    1. Espandere la sezione Impostazioni per vedere che questo nodo utilizza la modalità di punteggio Categorie come campi. Con questa modalità di punteggio, i record in uscita sono tanti quanti quelli in ingresso.
    2. Fare clic su Anteprima dati. Si può notare che ogni record contiene ora un nuovo campo per ogni categoria selezionata nella scheda Modello. Per ciascun campo, immettere un valore indicatore per i valori true e false, come, ad esempio, True/False oppure 1/0. In questo flusso, i valori sono impostati su 1 e 0 per aggregare i risultati e contare il numero di risposte positive, negative, miste (positive e negative) o senza punteggio (nessuna opinione).

      Figura 8. Risultati del modello - categorie come campi (1).
      Risultati del modello - categorie come campi. Si tratta di una tabella con le colonne ID, Commenti, Genere, Motivo, Neg, Pos, Cont e Sentimento. Le voci della colonna ID sono numeri. Le voci della colonna Commenti mostrano brevi frasi estratte dal testo. Ad esempio, una voce dice che è molto silenzioso, ma molto costoso. Le voci della colonna Motivo indicano se il viaggio è stato effettuato per lavoro o per piacere. Neg e Pos mostrano il conteggio dei sentimenti negativi e positivi per ogni frase breve. Il sentimento mostra se la recensione è stata positiva (solo numeri nella colonna Pos), negativa (solo numeri nella colonna Neg) o mista (numeri in entrambe le colonne Neg e Pos).
    3. Chiudere la finestra Anteprima.
    4. Fare clic su Annulla.
  7. Fare doppio clic sul secondo nodo Modello di soddisfazione.
    1. Espandere la sezione Impostazioni per vedere che questo nodo utilizza la modalità di punteggio Categorie come record. Per ogni coppia di " category, document viene creato un nuovo record. Generalmente, nell'output è presente un numero maggiore di record rispetto all'input.
    2. Fare clic su Anteprima dati. Si può notare che, oltre ai campi di input, vengono aggiunti nuovi campi ai dati, a seconda del tipo di modello.

      Figura 9. Risultati del modello - categorie come record (2).
      Risultati del modello - categorie come record. Si tratta di una tabella con le colonne ID, Commenti, Genere, Motivo, Categoria e Sentimento. Le voci della colonna ID sono numeri. Le voci della colonna Commenti mostrano brevi frasi estratte dal testo. Ad esempio, una voce dice che è molto silenzioso, ma molto costoso. Le voci della colonna Motivo indicano se il viaggio è stato effettuato per lavoro o per piacere. Neg e Pos mostrano il conteggio dei sentimenti negativi e positivi per ogni frase breve. Il sentimento mostra se la recensione è stata positiva (solo numeri nella colonna Pos), negativa (solo numeri nella colonna Neg) o mista (numeri in entrambe le colonne Neg e Pos).
    3. Chiudere la finestra Anteprima.
    4. Fare clic su Annulla.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il modello di soddisfazione con un'anteprima del documento. Ora siete pronti a visualizzare i commenti.

Nodo del modello

torna all'inizio

Compito 6: Visualizzare i commenti

Visualizzando i commenti, è possibile ottenere rapidamente informazioni su ciò che gli ospiti apprezzano dell'hotel. Seguite questi passaggi per creare un grafico a nuvola di parole:

  1. Selezionate i commenti positivi:
    1. Nella palette, espandere la sezione Operazioni di registrazione.
    2. Trascinare il nodo Select sull'area di disegno.
    3. Collegare il supernodo Derive Sentiment al nodo Select.
    4. Fare doppio clic sul nodo Select per visualizzarne le proprietà.
    5. Per la Modalità, selezionare Includi.
    6. Per la condizione, digitare 'Sentiment = "Pos".
    7. Fare clic su Salva.
  2. Aggiungere un grafico:
    1. Nella tavolozza, espandere la sezione Grafici.
    2. Trascinare il nodo Grafici sull'area di disegno.
    3. Collegare il nodo Select al nodo Charts.
  3. Costruire un grafico a nuvola di parole:
    1. Fare doppio clic sul nodo Grafici per visualizzarne le proprietà.
    2. Fare clic su Avvia costruttore di grafici.
    3. Per le colonne da visualizzare, selezionare Commenti.
    4. Visualizzare l'elenco di tutti i tipi di grafico e selezionare Nuvola di parole.

      Figura 10. Tutti i tipi di grafico
      Tutti i tipi di grafico
  4. Al termine, fare clic su Torna al flusso.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra un grafico a nuvola di parole. Ora si è pronti a esaminare il nodo Analisi dei collegamenti testuali.

Grafico a nuvola di parole

torna all'inizio

Compito 7: Esaminare il nodo Analisi dei collegamenti testuali

A volte, potrebbe non essere necessario creare un modello di categoria per ottenere un punteggio. Il nodo Text Link Analysis aggiunge una tecnologia di pattern-matching all'estrazione di concetti del text mining. Il nodo Analisi dei collegamenti testuali identifica le relazioni tra i concetti nei dati testuali sulla base di modelli noti. Queste relazioni possono descrivere il sentimento di un cliente su un prodotto, quali aziende fanno affari insieme o anche le relazioni tra geni o agenti farmaceutici. Per esaminare il nodo Analisi dei collegamenti testuali, procedere come segue:
Nodo TLA
  1. Fare doppio clic sul nodo Analisi dei collegamenti testuali per visualizzarne le proprietà.
  2. Impostare queste proprietà nella sezione Campi:
    1. Per il campo Testo, selezionare Commenti.
    2. Per il campo ID, selezionare id.
      Nota: solo il campo Testo è obbligatorio.

      Figura 11. Proprietà FIELD del nodo Analisi dei collegamenti testuali.
      Proprietà FIELD del nodo Analisi dei collegamenti testuali. Mostra le impostazioni dei campi come il campo ID, il campo Testo, il campo Lingua, il Tipo di documento, l'Unità testuale e le impostazioni della modalità Paragrafo.
  3. Nella sezione Copia risorse da, notate che il modello di risorsa selezionato è Hotel Satisfaction (inglese).

    Un modello di risorsa è un insieme predefinito di librerie e risorse linguistiche e non linguistiche avanzate che sono state messe a punto per un particolare dominio o utilizzo.

  4. Espandere la sezione Esperto e verificare che l'opzione Adatta l'ortografia per una parola di lunghezza minima di caratteri sia selezionata con un limite ortografico di '5.

    Figura 12. Proprietà dell'esperto del nodo Analisi dei collegamenti testuali.
    Proprietà dell'esperto del nodo Analisi dei collegamenti testuali. Vengono visualizzate caselle di controllo per impostazioni quali Accommoda l'ortografia per un limite minimo di caratteri della radice, Estrai gli unitari, Estrai le entità non linguistiche, Algoritmo maiuscolo, Raggruppa i nomi di persona parziali e completi insieme quando possibile e Usa la derivazione quando raggruppa i sostantivi composti.
  5. Fare clic su Salva.
  6. Passare il mouse sul nodo di output Raw TLA e fare clic sull'icona Esegui 'Icona di esecuzione.
  7. Nel riquadro Output e modelli, fare clic sui risultati con il nome Output TLA grezzo per visualizzare i risultati.

    Figura 13. Uscita TLA grezza.
    Uscita TLA grezza. Si tratta di una tabella con colonne quali Concept1, Type1, Concept2, Type2, ID e Testo corrispondente. Le voci per le colonne di concetto sono parole come camera o parcheggio. Le voci per le colonne di tipo sono parole come Budget o Servizi. Le righe mostrano come un concetto sia collegato a un tipo o ad altri concetti. Ogni riga mostra anche come queste parole appaiono nel testo.

    Figura 14. Conteggio dei sentimenti su un nodo TLA.
    Conteggio dei sentimenti su un nodo TLA. Si tratta di una tabella con le colonne ID, Commenti, Pos_Count_Sum e Neg_Count_Sum. Le voci della colonna ID sono numeri per ogni riga. Le voci della colonna Commenti mostrano brevi frasi estratte dal testo. Ad esempio, una voce dice: "Camere confortevoli, colazione eccezionale e servizio gentile". Le voci delle colonne Pos_Count_Sum e Neg_Count_Sum mostrano i numeri che contano il numero di sentimenti positivi o negativi per ogni frase breve. Ad esempio, per la frase precedente ha contato tre sentimenti positivi.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il flusso completato.

Flusso completato

torna all'inizio

Riepilogo

Questo flusso di soddisfazione alberghiera ha mostrato come un direttore d'albergo possa analizzare le recensioni degli hotel per vedere le opinioni espresse dai clienti su personale, comfort, pulizia, prezzo e altre aree di interesse. Questo flusso illustra due modi per analizzare i dati di testo, utilizzando un nodo Text Mining o un nodo Text Link Analysis.

Passi successivi

Ora siete pronti per provare altre esercitazioni diSPSS® Modeler.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni