0 / 0
Torna alla versione inglese della documentazione
Introduzione rapida: creare un modello utilizzando SPSS Modeler

Introduzione rapida: creare un modello utilizzando SPSS Modeler

È possibile creare, addestrare e distribuire modelli utilizzando SPSS Modeler. Leggi le informazioni su SPSS Modeler, quindi guarda un video e segui un'esercitazione adatta ai principianti e che non richiede codifica.

Servizi richiesti
Watson Studio (che include SPSS Modeler)
Watson Machine Learning

Il flusso di lavoro di base include le seguenti attività:

  1. Aprire il progetto sandbox. I progetti sono dove è possibile collaborare con altri per lavorare con i dati.
  2. Aggiungere un flusso SPSS Modeler al progetto.
  3. Configurare i nodi nell'area ed eseguire il flusso.
  4. Esaminare i dettagli del modello e salvare il modello.
  5. Distribuire e verificare il modello.

Informazioni su SPSS Modeler

Con i flussi SPSS Modeler , è possibile sviluppare rapidamente modelli predittivi utilizzando l'esperienza di business e distribuirli nelle operazioni di business per migliorare il processo decisionale. Progettata in base al software client SPSS Modeler e al modello CRISP - DM standard di settore utilizzato, l'interfaccia dei flussi supporta l'intero processo di data mining, dai dati ai migliori risultati di business.

SPSS Modeler offre una varietà di metodi di modellazione ricavati dall'apprendimento automatico, dall'intelligenza artificiale e dalle statistiche. I metodi disponibili nella palette dei nodi consentono di ricavare nuove informazioni dai dati e di sviluppare modelli predittivi. Ogni metodo ha determinati punti di forza e si presta meglio per particolari tipi di problemi.

Ulteriori informazioni su SPSS Modeler

Ulteriori informazioni su altri modi per creare modelli

Guardare un video sulla creazione di un modello utilizzando SPSS Modeler

Guarda il video Guarda questo video per scoprire come creare ed eseguire un flusso SPSS Modeler per addestrare un modello di machine learning.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.


Prova un'esercitazione per creare un modello utilizzando SPSS Modeler

In questa esercitazione, verranno completate le seguenti attività:

Il completamento di questa esercitazione richiede circa 30 minuti.

Dati di esempio

Il set di dati utilizzato in questo tutorial proviene dall'Università della California, Irvine, ed è il risultato di un ampio studio basato sulle ammissioni ospedaliere per un periodo di tempo. Il modello utilizzerà tre fattori importanti per aiutare a prevedere la malattia renale cronica.





Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàwatsonx.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Attività 1: apertura di un progetto

È necessario un progetto per memorizzare il flusso SPSS Modeler . È possibile utilizzare il progetto sandbox o creare un progetto.

  1. Dal Menu di navigazione Menu di navigazione, scegliere Progetti> Visualizza tutti i progetti

  2. Aprire il progetto sandbox. Se si desidera utilizzare un nuovo progetto:

    1. Fare clic su Nuovo progetto.

    2. Selezionare Crea un progetto vuoto.

    3. Immettere un nome e una descrizione facoltativa per il progetto.

    4. Scegliere un' istanza del servizio di archiviazione oggetti esistente o crearne una nuova.

    5. Fare clic su Crea.

Per ulteriori informazioni o per guardare un video, consultare Creazione di un progetto.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il nuovo progetto.

La seguente immagine mostra il nuovo progetto.




Attività 2: aggiungere il dataset al progetto

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 00:13.

Questa esercitazione utilizza un dataset di esempio. Attenersi alla seguente procedura per aggiungere il dataset di esempio al progetto:

  1. Accedere a UCI ML Repository: Cronica Reni Disease Data Set in Resource hub.

  2. Fare clic su Anteprima. Ci sono tre fattori importanti che aiutano a prevedere la malattia renale cronica che sono disponibili come parte di questa analisi: l'età del soggetto del test, i risultati del test della creatinina sierica e i risultati del test del diabete. E il valore della classe indica se il paziente è stato precedentemente diagnosticato per malattia renale.

  3. Fare clic su Aggiungi al progetto.

  4. Selezionare il progetto dall'elenco e fare clic su Aggiungi.

  5. Fare clic su Visualizza progetto.

  6. Dalla pagina Asset del progetto, individuare il file UCI ML Repository Cronica Rene Disease Data Set.csv .

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la scheda Asset nel progetto.

La seguente immagine mostra la scheda Asset nel progetto.




Attività 3: creare il flusso SPSS Modeler

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 01:11.

Attenersi alla seguente procedura per creare un flusso SPSS Modeler nel progetto:

  1. Fare clic su Nuovo asset> Crea modelli come flusso visivo.

  2. Immettere un nome e una descrizione per il flusso.

  3. Per la definizione di runtime, accettare la definizione Default SPSS Modeler S .

  4. Fare clic su Crea. Questo apre l'editor del flusso che verrà utilizzato per creare il flusso.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra l'Editor del flusso.

La seguente immagine mostra l'editor del flusso.




Attività 4: aggiunta dei nodi al flusso SPSS Modeler

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 01:31.

Dopo aver caricato i dati, è necessario trasformarli. Creare un semplice flusso trascinando i trasformatori e gli stimatori nell'area e collegandoli all'origine dati. Utilizzare i seguenti nodi dalla tavolozza:

  • Asset di dati: carica il file csv dal progetto

  • Partizione: divide i dati in segmenti di addestramento e di test

  • Tipo: imposta il tipo di dati. Utilizzarlo per designare il campo class come tipo target .

  • C5.0: un algoritmo di classificazione

  • Analisi: visualizzare il modello e verificarne la precisione

  • Tabella: anteprima dei dati con previsioni

Per creare il flusso, attenersi alla seguente procedura:

  1. Aggiungere il nodo asset di dati:

    1. Dalla sezione Importa , trascinare il nodo Asset dati nell'area di disegno.

    2. Fare doppio clic sul nodo Asset dati per selezionare il dataset.

    3. Selezionare Asset dati> Dati malattia renale cronica repository UCI Set.csv.

    4. Fare clic su Seleziona.

    5. Visualizzare le proprietà dell'asset di dati.

    6. Fare clic su Salva.

  2. Aggiungere il nodo Partizione:

    1. Dalla sezione Operazioni sul campo , trascinare il nodo Partizione nell'area.

    2. Collegare il nodo Asset dati al nodo Partizione .

    3. Fare doppio clic sul nodo Partizione per visualizzare le proprietà. La partizione predefinita divide metà dei dati per l'addestramento e l'altra metà per il test.

    4. Fare clic su Salva.

  3. Aggiungere il nodo Tipo:

    1. Dalla sezione Operazioni sul campo , trascinare il nodo Tipo nell'area.

    2. Connettere il nodo Partizione al nodo Tipo .

    3. Fare doppio clic sul nodo Tipo per visualizzarne le proprietà. Il nodo Tipo specifica il livello di misurazione per ogni campo. Questo file di dati di origine utilizza quattro diversi livelli di misurazione: continuo, categoriale, nominale, ordinale e flag.

    4. Ricercare il campo class . Per ogni campo, il ruolo indica la parte che ogni campo svolge nella modellazione. Modificare il class Ruolo in Obiettivo - il campo che si desidera prevedere.

    5. Fare clic su Salva.

  4. Aggiungere il nodo dell'algoritmo di classificazione C5.0 :

    1. Dalla sezione Modeling , trascinare il nodo C5.0 nell'area.

    2. Collegare il nodo Tipo a C5.0 .

    3. Fare doppio clic su C5.0 per visualizzare le proprietà. Per impostazione predefinita, l'algoritmo C5.0 crea un albero decisionale. Un modello C5.0 funziona suddividendo l'esempio in base al campo che fornisce il massimo guadagno di informazioni. Ogni sottocampione definito dalla prima suddivisione viene quindi suddiviso di nuovo, di solito in base a un campo differente, e il processo si ripete fino a quando non è possibile suddividere ulteriormente i sottocampioni. Infine, vengono riesaminate le suddivisioni di livello più basso e quelle che non contribuiscono in modo significativo al valore del modello vengono rimosse.

    4. Attivare Utilizza impostazioni definite in questo nodo.

    5. Per Target, selezionare class.

    6. Nella sezione Input , fare clic su Aggiungi colonne.

      1. Deselezionare la check box accanto a Nome campo.

      2. Selezionare age, sc, dm.

      3. Fare clic su OK.

    7. Fare clic su Salva.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il flusso completato.

flusso che mostra il nodo Asset dati, il nodo Partizione, il nodo Tipo e il nodo della classe C5.0




Attività 5: eseguire il flusso SPSS Modeler ed esplorare i dettagli del modello

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 04:20.

Ora che il flusso è stato progettato, seguire questi passi per eseguire il flusso ed esaminare il diagramma della struttura ad albero per vedere i punti di decisione:

  1. Fare clic con il pulsante destro del mouse sul nodo C5.0 e selezionare Esegui. L'esecuzione del flusso genera un nuovo nugget del modello nell'area.

  2. Fare clic con il tasto destro del mouse sull'insieme di modelli e selezionare Visualizza modello per visualizzare i relativi dettagli.

  3. Visualizzare le informazioni sul modello che forniscono un riepilogo del modello.

  4. Fare clic su Regole decisionali principali. Una tabella visualizza una serie di regole che sono state utilizzate per assegnare singoli record a nodi figlio in base ai valori di campi di input diversi.

  5. Fare clic su Importanza funzione. Un grafico mostra l'importanza relativa di ciascun predittore nella stima del modello. Da questo, puoi vedere che la creatinina sierica è facilmente il fattore più significativo, con il diabete che è il prossimo fattore più significativo.

  6. Fare clic su Diagramma ad albero. Lo stesso modello viene visualizzato sotto forma di albero, con un nodo in ogni punto di decisione.

    1. Passare con il mouse sul nodo superiore, che fornisce un riepilogo per tutti i record nel dataset. Quasi il 40% dei casi nel set di dati sono classificati come non diagnosticati con malattia renale. La struttura ad albero può fornire ulteriori indizi su quali fattori potrebbero essere responsabili.

    2. Notare i due rami che derivano dal nodo superiore, che indica una suddivisione per creatinina sierica.

      • Esaminare il ramo che mostra i record in cui la creatinina sierica è maggiore di 1.25. In questo caso, il 100% di questi pazienti ha una diagnosi positiva di malattia renale.

      • Esaminare il ramo che mostra i record in cui la creatinina sierica è inferiore o uguale a 1.25. Quasi l'80% di questi pazienti non ha una diagnosi positiva di malattia renale, ma quasi il 20% con una creatinina sierica più bassa è stato ancora diagnosticato con malattia renale.

    3. Si noti che i rami derivano da sc<=1.250, che è suddiviso per diabete.

      • Esaminare il ramo che mostra i pazienti con bassa creatinina sierica (sc<=1.250) e diabete diagnosticato (dm = sì). Anche al 100% di questi pazienti è stata diagnosticata una malattia renale.

      • Esaminare il ramo che mostra i pazienti con una bassa creatinina sierica (sc<=1.250) e nessun diabete (dm = no), l'85% non è stato diagnosticato con malattia renale, ma il 15% di loro è stato ancora diagnosticato con malattia renale.

    4. Si noti che i rami derivano da dm = no, che è suddiviso per l'ultimo fattore significativo, età.

      • Esaminare il ramo che mostra i pazienti di età pari o inferiore a 14 anni (età < = 14). Questo ramo mostra che il 75% dei pazienti giovani con bassa creatinina sierica e nessun diabete era a rischio di malattia renale.

      • Rivedere il ramo che mostra i pazienti di età superiore a 14 anni (età> 14). Questa branca mostra che solo il 12% dei pazienti di età superiore ai 14 anni con bassa creatinina sierica e nessun diabete era a rischio di malattia renale.

    5. Chiudere i dettagli del modello.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra il diagramma della struttura ad albero.

La seguente immagine mostra il diagramma della struttura ad albero.




Attività 6: valutazione del modello

video dell'esercitazione di anteprima Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 07:00.

Attenersi alla seguente procedura per utilizzare i nodi Analisi e Tabella per valutare il modello:

  1. Dalla sezione Output , trascinare il nodo Analisi nell'area.

  2. Connettere l'insieme di modelli Modello al nodo Analisi .

  3. Fare clic con il tasto destro del mouse su Analysis e selezionare Esegui.

  4. Dal pannello Output , aprire Analisi, che mostra che il modello ha previsto correttamente una diagnosi di malattia renale quasi il 95% del tempo. Chiudere Analisi.

  5. Fare clic con il pulsante destro del mouse su Analisi e selezionare Salva ramo come modello.

    1. Per il Nome modello, immettere Kidney Disease Analysis.

    2. Fare clic su Salva.

    3. Fare clic su Chiudi.

  6. Dalla sezione Output , trascinare il nodo Tabella nell'area.

    1. Collegare l'insieme di modelli Modello al nodo Tabella .

    2. Fare clic con il pulsante destro del mouse sul nodo Tabella e selezionare Anteprima dati.

    3. Quando viene visualizzata l'anteprima, scorrere fino alle ultime due colonne. La colonna $C-Class contiene la previsione della malattia renale e la colonna $CC - Class indica il punteggio di confidenza per tale previsione.

    4. Chiudere l' Anteprima.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la tabella di anteprima con le previsioni.

La seguente immagine mostra la tabella di anteprima con le previsioni.




Attività 7: distribuzione e test del modello con nuovi dati

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 09:10.

Infine, seguire questi passi per distribuire questo modello e prevedere il risultato con nuovi dati.

  1. Tornare alla scheda Asset del progetto.

  2. Fare clic sulla sezione Modelli e aprire il modello Analisi della malattia renale .

  3. Fai clic sull'icona Promote to deployment space Promuovi nello spazio di distribuzione.

  4. Scegliere uno spazio di distribuzione esistente. Se non si dispone di uno spazio di distribuzione, è possibile crearne uno nuovo:

    1. Fornire un nome spazio.

    2. Selezionare un servizio di archiviazione.

    3. Selezionare un servizio di machine learning.

    4. Fare clic su Crea.

    5. Fare clic su Chiudi.

  5. Seleziona Vai al modello nello spazio dopo averlo promosso.

  6. Fare clic su Promuovi.

  7. Quando il modello viene visualizzato nello spazio di distribuzione, fare clic su Nuova distribuzione.

    1. Selezionare In linea come Tipo di distribuzione.

    2. Specificare un nome per la distribuzione.

    3. Fare clic su Crea.

  8. Una volta completata la distribuzione, fare clic sul nome della distribuzione per visualizzare la pagina dei dettagli della distribuzione.

  9. Andare alla scheda Test . Puoi verificare il modello distribuito dalla pagina dei dettagli di distribuzione in due modi: test con un modulo o test con codice JSON.

  10. Fare clic su Input JSON, quindi copiare i seguenti dati di test e incollarli per sostituire il testo JSON esistente:

    {
       "input_data": [
          {
             "fields": [
                         "age",
                         "bp",
                         "sg",
                         "al",
                         "su",
                         "rbc",
                         "pc",
                         "pcc",
                         "ba",
                         "bgr",
                         "bu",
                         "sc",
                         "sod",
                         "pot",
                         "hemo",
                         "pcv",
                         "wbcc",
                         "rbcc",
                         "htn",
                         "dm",
                         "cad",
                         "appet",
                         "pe",
                         "ane",
                         "class"
             ],
             "values": [
                        [
                        "62",
                         "80",
                         "1.01",
                         "2",
                         "3",
                         "normal",
                         "normal",
                         "notpresent",
                         "notpresent",
                         "423",
                         "53",
                         "1.8",
                         "",
                         "",
                         "9.6",
                         "31",
                         "7500",
                         "",
                         "no",
                         "yes",
                         "no",
                         "poor",
                         "no",
                         "yes",
                         "ckd"
                         ]
             ]
          }
       ]
    }
    
  11. Fare clic su Previsione per prevedere se a un bambino di 62 anni con diabete e un rapporto di creatinina sierica di 1.8 potrebbe essere diagnosticata una malattia renale. La previsione risultante indica che questo paziente ha un'alta probabilità di una diagnosi di malattia renale.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la scheda Test per la distribuzione del modello con una previsione.

La seguente immagine mostra la scheda Test per la distribuzione del modello con una previsione.



Passi successivi

Ora è possibile utilizzare questo dataset per ulteriori analisi. Ad esempio, è possibile eseguire attività quali:

Ulteriori risorse

Argomento principale: Esercitazioni introduttive

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni