0 / 0
Torna alla versione inglese della documentazione
Automatizzare la modellazione per un obiettivo continuo
Ultimo aggiornamento: 11 dic 2024
Automatizzare la modellazione per un obiettivo continuo

Questa esercitazione utilizza il nodo Auto Numeric per creare e confrontare automaticamente diversi modelli per risultati continui (intervallo numerico), come la previsione del valore imponibile di una proprietà. Con un singolo nodo è possibile stimare e confrontare una serie di modelli candidati e generare un sottoinsieme di modelli per ulteriore analisi. Il nodo funziona come il nodo Auto Classifier, ma per gli obiettivi continui anziché per quelli a bandiera o nominali.

Il nodo combina i migliori modelli candidati in un singolo nugget del modello modello aggregato (nell'insieme). Questo approccio combina la facilità di automazione con i vantaggi di combinare più modelli il che spesso fornisce previsioni più precise rispetto a quelle che si possono ottenere da un solo modello.

Questo esempio si focalizza su un responsabile di un comune fittizio per regolare e valutare la tassazione immobiliare. Per raggiungere questo obiettivo in modo più accurato, si costruisce un modello che prevede i valori degli immobili in base al tipo di edificio, al quartiere, alle dimensioni e ad altri fattori noti.

Prova il tutorial

In questa esercitazione, completerete questi compiti:

Esempio di flusso di modellazione e set di dati

Questa esercitazione utilizza il flusso Automated Modeling for a Continuous Target nel progetto di esempio. Il file di dati utilizzato è property_values_train.csv. L'immagine seguente mostra il flusso del modellatore di esempio.

Figura 1. Flusso del modellatore di campioni
Flusso di esempio numerico automatico

Il file di dati include un campo denominato " taxable_value, che è il campo target, o valore, che si desidera prevedere. Gli altri campi contengono informazioni come il quartiere, il tipo di edificio e il volume interno e possono essere utilizzati come predittori.

Nome campo Etichetta
property_id ID proprietà
neighborhood Zona all'interno della città
building_type Tipo di edificio
year_built Anno di costruzione
volume_interior Volume interno
volume_other Volume garage e altri edifici
lot_size Dimensione lotto
taxable_value Valore imponibile
L'immagine seguente mostra il set di dati di esempio.
Figura 2. Dataset di esempio
Dataset di esempio

Compito 1: Aprire il progetto di esempio

Il progetto campione contiene diversi set di dati e flussi di modellazione di esempio. Se non si dispone già del progetto di esempio, consultare l'argomento Tutorial per creare il progetto di esempio. Seguite quindi i passaggi seguenti per aprire il progetto campione:

  1. In Cloud Pak for Data, dal menu di navigazione 'Menu di navigazione, scegliere Progetti > Visualizza tutti i progetti.
  2. Fare clic su ProgettoSPSS Modeler.
  3. Fare clic sulla scheda Assets per visualizzare i set di dati e i flussi del modellatore.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra la scheda Assets del progetto. Ora si è pronti a lavorare con il flusso del modellatore di esempio associato a questa esercitazione.

Progetto di esempio

torna all'inizio

Compito 2: Esaminare i nodi Asset e Tipo di dati

La modellazione automatizzata per un obiettivo continuo comprende diversi nodi. Seguire i seguenti passaggi per esaminare i nodi 'Asset di dati e 'Tipo:

  1. Dalla scheda Risorse, aprire il flusso di modellazione automatica per un obiettivo continuo e attendere il caricamento dell'area di disegno.
  2. Fate doppio clic sul nodo property_values_train.csv. Questo nodo è un nodo di risorse dati che punta al file property_values_train.csv del progetto.
  3. Esaminare il 'Proprietà del formato del file.
  4. Facoltativo: Fare clic su Anteprima dati per visualizzare l'intero set di dati.
  5. Fare doppio clic sul nodo Tipo.
  6. Per il campo Valore_imponibile, impostare il Ruolo su Destinazione. Altri campi sono utilizzati come predittori.
    Figura 3 Impostare il livello di misurazione e il ruolo
    Impostare il ruolo
  7. Facoltativo: Fare clic su Anteprima dati per visualizzare il set di dati filtrati.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il nodo Tipo. Ora si è pronti a configurare il nodo di modellazione.

Nodo Tipo

torna all'inizio

Attività 3: Configurazione del nodo di modellazione

Questo esempio utilizza un nodo di modellazione numerica automatica che stima e confronta i modelli per provare vari approcci per un intervallo numerico continuo. Seguire la seguente procedura per configurare il nodo di modellazione:

  1. Fare doppio clic sul nodo Valore imponibile per visualizzarne le proprietà.
  2. Espandere la sezione Fondamenti e impostare le seguenti proprietà:
    1. Per il campo Classificare i modelli in base a, selezionare Correlazione.
    2. Per il campo Numero di modelli da utilizzare, digitare '3. Ciò significa che i tre modelli migliori saranno costruiti quando si esegue il nodo.
    Figura 4. Sezione Nozioni di base sul nodo numerico automatico
    Impostare le proprietà di base
  3. Espandere la sezione Esperto. Vengono selezionati sei algoritmi, per cui il nodo stima un singolo modello per ogni algoritmo, per un totale di sei modelli. (In alternativa, è possibile modificare queste impostazioni per confrontare più varianti per ogni tipo di modello). Avendo impostato la proprietà Numero di modelli da utilizzare su '3 nella sezione Fondamenti, il nodo calcola l'accuratezza dei sei algoritmi e costruisce un'unica pepita modello contenente i tre più accurati.
    Figura 5. Nodo numerico automatico Sezione esperti
    Impostare le proprietà dell'esperto
  4. Espandere la sezione Ensemble per visualizzare le impostazioni predefinite. Poiché in questo esempio si utilizza un target continuo, il punteggio dell'ensemble è generato dalla media dei punteggi dei singoli modelli.
    Figura 6. Nodo numerico automatico Sezione Ensemble
    Opzioni dell'ensemble

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il nodo Modellazione. Ora siete pronti a confrontare i modelli.

Nodo modellazione

torna all'inizio

Compito 4: confrontare i modelli

Ora che sono stati specificati i tre modelli da costruire, seguite i passaggi seguenti per generare e confrontare i modelli:

  1. Passare il mouse sul nodo taxable_value e fare clic sull'icona Run 'Icona di esecuzione.
  2. Nel riquadro Output e modelli, fare clic sui risultati con il nome valore_imponibile per visualizzare i risultati.

    Si vedranno i dettagli di ciascuno dei modelli creati durante l'esecuzione. (In una situazione reale, in cui centinaia di modelli vengono stimati su un ampio set di dati, l'esecuzione del flusso potrebbe richiedere molte ore) La tabella contiene una serie di modelli generati dal nodo Modellazione.

  3. Per approfondire i singoli modelli, fare clic sul nome del modello nella colonna Estimator per visualizzare i risultati del singolo modello.
    1. Visualizzare la pagina delle informazioni sul modello. Questa tabella contiene informazioni sul tipo di modello montato, identifica il campo di destinazione, il numero di caratteristiche di ingresso, le funzioni di attivazione e la dimensione della rete risultante.
    2. Visualizzare le altre pagine del modello.
    3. Chiudere i dettagli del modello.

    Per impostazione predefinita, i modelli sono ordinati in base all'accuratezza (correlazione) perché è stata selezionata la correlazione come misura nelle proprietà del nodo Auto Numeric. Per la classificazione, viene utilizzato il valore assoluto di precisione con valori vicini a 1 che indica una relazione più stretta.

    È possibile ordinare una differente colonna facendo clic sull'intestazione per tale colonna.

    In base a questi risultati, si decide di utilizzare tutti e tre questi modelli precisi. Combinando le previsioni di più modelli, si possono evitare le limitazioni dei singoli modelli, ottenendo una maggiore accuratezza complessiva.

  4. Verificare che tutti e tre i modelli siano selezionati nella colonna Utilizzo.
  5. Chiudere la finestra View Model: taxable_value.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra la tabella di confronto dei modelli. Ora si è pronti a eseguire l'analisi del modello.

Risultati modello

torna all'inizio

Task 5: Esecuzione del nodo Analisi

Dopo aver visualizzato un confronto tra i tre modelli, è possibile seguire i seguenti passaggi per eseguire un'analisi dei modelli:

  1. Passare il mouse sul nodo Analisi e fare clic sull'icona Esegui 'Icona di esecuzione.
  2. Nel riquadro Output e modelli, fare clic sui risultati di output con il nome Analisi per visualizzare i risultati.

    Il punteggio medio generato dal modello assemblato viene aggiunto in un campo denominato " $XR-taxable_value, con una correlazione di 0.934, superiore ai punteggi dei tre singoli modelli. I punteggi dell'ensemble mostrano anche un basso errore assoluto medio e potrebbero avere prestazioni migliori dei singoli modelli se applicati ad altri set di dati.

Icona del punto di controllo Controllare i progressi

L'immagine seguente mostra il confronto del modello dal nodo Analisi.

Risultati dell'analisi

torna all'inizio

Riepilogo

Con questo esempio di flusso " Modellazione automatizzata per un obiettivo a bandiera, si è utilizzato il nodo " Auto Numerico per confrontare diversi modelli, si sono selezionati i tre modelli più accurati e li si è aggiunti al flusso all'interno di un nugget di modello Auto Numeric assemblato.

Il modello assemblato ha mostrato prestazioni migliori rispetto a due dei singoli modelli e potrebbe ottenere risultati migliori se applicato ad altri set di dati. Se l'obiettivo è automatizzare il più possibile il processo, questo approccio consente di ottenere un modello robusto nella maggior parte delle circostanze, senza dover scavare a fondo nelle specificità di ogni singolo modello.

Passi successivi

Ora siete pronti per provare altre esercitazioni diSPSS® Modeler.

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni