Puoi automatizzare il processo di creazione di un modello di machine learning con lo strumento AutoAI . Leggi le informazioni sullo strumento AutoAI , guarda un video e fai un'esercitazione adatta ai principianti e che non richiede codifica.
- Servizi richiesti
- studio watsonx.ai
- runtime watsonx.ai
Il flusso di lavoro di base include le seguenti attività:
- Creare un progetto. I progetti sono dove è possibile collaborare con altri per lavorare con i dati.
- Aggiungere i propri dati al progetto. È possibile aggiungere file CSV o dati da un'origine dati remota tramite una connessione.
- Creare un esperimento AutoAI nel progetto.
- Esaminare le pipeline del modello e salvare la pipeline desiderata come modello da distribuire o come notebook da personalizzare.
- Distribuire e verificare il modello.
Leggi le informazioni su AutoAI
Lo strumento grafico AutoAI analizza automaticamente i tuoi dati e genera pipeline di modelli candidati personalizzate per il tuo problema di modellazione predittiva. Queste pipeline del modello vengono create in modo iterativo quando AutoAI analizza il dataset e rileva le trasformazioni dei dati, gli algoritmi e le impostazioni dei parametri che funzionano meglio per le impostazioni dei problemi. I risultati vengono visualizzati in una classifica, mostrando le pipeline del modello generate automaticamente ordinate in base all'obiettivo di ottimizzazione del problema.
Guarda un video sulla creazione di un modello utilizzando AutoAI
Guarda questo video per scoprire come creare ed eseguire un esperimento di AutoAI basato sull'esempio di marketing della banca.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Trascrizione del video Ora Trascrizione 00:00 Questo video mostra come eseguire un esperimento AutoAI di esempio per creare un modello di Machine Learning. 00:08 Avviare un progetto e aggiungervi un nuovo esperimento AutoAI. 00:16 Per eseguire un esperimento AutoAI, è necessario il servizio Machine Learning. 00:22 Qui si ha la possibilità di associare un servizio di Machine Learning a questo progetto. 00:29 Puoi creare una nuova istanza del servizio o selezionare un'istanza del servizio esistente. 00:39 Quando ritorni alla pagina in cui stai creando l'esperimento, ricarica la pagina e vedrai elencata la nuova istanza del servizio. 00:48 Per questo primo esperimento, verrà selezionato un esempio. 00:52 L'esempio "Marketing bancario" contiene i dati di testo raccolti dalle chiamate telefoniche a una banca in risposta a una campagna di marketing. 01:01 Quando si seleziona un campione, il nome esperimento e la descrizione vengono compilati automaticamente, in modo da essere pronti a creare l'esperimento. 01:11 Viene quindi visualizzato il programma di creazione di esperimenti AutoAI . 01:15 Poiché questo esperimento proviene da un esempio, il file di origine di marketing della banca è già selezionato. 01:22 E la colonna da prevedere è già selezionata. 01:26 In questo caso, è la colonna "y", che rappresenta se un utente si iscriverà per un deposito a termine come parte della campagna di marketing. 01:35 In base al set di dati e alla colonna selezionata da prevedere, AutoAI analizza un sottoinsieme di dati e sceglie un tipo di previsione e una metrica da ottimizzare. 01:47 In questo caso, poiché la colonna da prevedere contiene valori di "Y" o "N" (per sì o no), è stata scelta la classificazione binaria. 01:57 La classe positiva è "Sì" e la metrica ottimizzata è ROC AUC. 02:03 La metrica ROC AUC bilancia precisione, precisione e richiamo. 02:10 Ora, esegui l'esperimento e attendi che la "Leaderboard Pipeline" si riempia. 02:17 Durante la formazione AutoAI , il dataset è suddiviso in due parti: dati di addestramento e dati di holdout. 02:24 I dati di training vengono utilizzati dalle fasi di training AutoAI per generare le pipeline di modello e i punteggi di convalida incrociata vengono utilizzati per classificarli. 02:34 Dopo l'addestramento, i dati di controllo vengono utilizzati per la valutazione del modello di pipeline risultante e il calcolo delle informazioni sulle prestazioni, come le curve ROC e le matrici di confusione. 02:48 Successivamente, AutoAI genera le pipeline utilizzando diversi stimatori, come il classificatore XGBoost, o miglioramenti, come l'ottimizzazione degli iperparametri e la progettazione delle funzionalità, con le pipeline classificate in base alla metrica di precisione. 03:06 L'ottimizzazione degli iperparametri è un meccanismo per esplorare automaticamente uno spazio di ricerca di potenziali iperparametri, creando una serie di modelli e confrontando i modelli utilizzando le metriche di interesse. 03:20 La progettazione delle funzioni tenta di trasformare i dati grezzi nella combinazione di funzioni che rappresenta al meglio il problema per ottenere la previsione più accurata. 03:31 Ok, la corsa e'stata completata. 03:34 La legenda spiega dove trovare i dati, l'algoritmo principale, le pipeline e i trasformatori di funzioni sulla mappa di relazioni. 03:44 È possibile visualizzare il log completo per visualizzare i dettagli completi. 03:48 Per impostazione predefinita, viene visualizzata la "Mappa delle relazioni", ma è possibile scambiare le viste per visualizzare la "Mappa dei progressi". 03:57 Scorri verso il basso per dare un'occhiata alla classifica. 04:01 È possibile iniziare con il confronto delle pipeline. 04:05 Questo grafico fornisce le metriche per le otto pipeline, visualizzate in base al punteggio di convalida incrociata o in base al punteggio di holdout. 04:13 È possibile visualizzare le pipeline classificate in base ad altre metriche, ad esempio la precisione media. 04:21 Tornare alla scheda "Riepilogo esperimento", espandere una pipeline per visualizzare le misure di valutazione del modello e la curva ROC. 04:30 È possibile visualizzare una singola pipeline per visualizzare ulteriori dettagli oltre alla matrice di confusione, alla curva di richiamo di precisione, alle informazioni sul modello, alle trasformazioni della funzione e all'importanza della funzione. 04:49 Questa pipeline aveva la posizione più alta, quindi puoi salvarla come modello di machine learning. 04:55 Accettare le impostazioni predefinite e salvare il modello. 05:01 Ora che hai addestrato il modello, sei pronto a visualizzare il modello e distribuirlo. 05:06 La scheda "Panoramica" mostra un riepilogo del modello e lo schema input. 05:12 Per distribuire il modello, è necessario promuoverlo in uno spazio di distribuzione. 05:17 Poiché questo progetto non dispone ancora di uno spazio di distribuzione associato, sarà necessario configurare prima l'associazione. 05:25 È possibile selezionare uno spazio di distribuzione esistente o creare un nuovo spazio di distribuzione. 05:31 Quando si crea un nuovo spazio, è sufficiente fornire un nome e una descrizione e selezionare il servizio Cloud Object Storage and Machine Learning. 05:41 Quindi creare lo spazio. 05:45 Ora, selezionare questo nuovo spazio, aggiungere una descrizione per il modello e fare clic su "Promuovi". 05:53 Utilizzare il link per andare nello spazio di distribuzione. 06:00 Ecco il modello appena creato, che è ora possibile distribuire. 06:04 In questo caso, sarà una distribuzione online. 06:08 Fornire un nome per la distribuzione e fare clic su "Crea". 06:12 Quindi attendere la distribuzione del modello. 06:16 Quando la distribuzione del modello è completa, visualizzare la distribuzione. 06:20 Nella scheda "Riferimento API", troverai l'endpoint di calcolo del punteggio per riferimenti futuri. 06:26 Troverai anche frammenti di codice per vari linguaggi di programmazione per utilizzare questa distribuzione dalla tua applicazione. 06:35 Nella scheda "Test", è possibile verificare la previsione del modello. 06:40 È possibile immettere i dati di input di test o incollare i dati di input JSON, quindi fare clic su "Previsione". 06:52 Ciò mostra che c'è una probabilità molto alta che la prima persona non sottoscriverà un deposito a termine e un'alta probabilità che la seconda persona sottoscriverà un deposito a termine. 07:06 E di nuovo nel progetto, nella scheda "Asset", troverai l'esperimento AutoAI e il modello. 07:17 Trova ulteriori video nella documentazione Cloud Pak for Data as a Service .
Prova un'esercitazione per creare un modello utilizzando AutoAI
Questa esercitazione guida l'utente attraverso la formazione di un modello per prevedere se un cliente è probabile che si sottoscriva a un deposito di termini basato su una campagna di marketing.
In questa esercitazione, verranno completate le seguenti attività:
- Attività 1: aprire un progetto.
- Attività 2: creare e preparare il modello.
- Attività 2: promuovere il modello a uno spazio di distribuzione e distribuire il modello sottoposto a training
- Attività 4: verificare il modello distribuito.
- Attività 5: creare un lavoro batch per calcolare il punteggio del modello.
Il completamento di questa esercitazione richiede circa 30 minuti.
Dati campione
I dati di esempio utilizzati nell'esperienza guidata sono UCI: Dati di marketing della banca utilizzati per prevedere se un cliente si iscrive a una promozione promotion.The vengono caricati automaticamente e disponibili per l'utente quando si seleziona Esempio hub di risorse come base per l'esperimento.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se si ha bisogno di aiuto con questa esercitazione, è possibile porre una domanda o trovare una risposta nella sezione 'Cloud Pak for Data Forum di discussione della comunità.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Attività 1: apertura di un progetto
È necessario un progetto per memorizzare i dati e l'esperimento AutoAI . È possibile utilizzare un progetto esistente o creare un progetto.
Dal menu di navigazione ', scegliere Progetti > Visualizza tutti i progetti
Aprire un progetto esistente. Se si desidera utilizzare un nuovo progetto:
Fare clic su Nuovo progetto.
Selezionare Crea un progetto vuoto.
Immettere un nome e una descrizione facoltativa per il progetto.
Scegliere un'istanza del servizio di archiviazione oggetti esistente o crearne una nuova.
Fare clic su Crea.
Quando il progetto si apre, fai clic sulla scheda Manage e seleziona la pagina Services and integrations .
Sulla scheda IBM , fare clic su Associa servizio.
Selezionare l'istanza del runtime watsonx.ai. Se non si dispone ancora di un'istanza del servizio watsonx.ai Runtime, seguire questi passaggi:
Fare clic su Nuovo servizio.
Selezionare watsonx.ai Runtime.
Fare clic su Crea.
Selezionare la nuova istanza del servizio dall'elenco.
Fare clic su Associa servizio.
Se necessario, fare clic su Annulla per tornare alla pagina Servizi & Integrazioni .
Per ulteriori informazioni o per vedere un video, vedere Creazione di un progetto. Per ulteriori informazioni sui servizi associati, vedere Aggiunta di servizi associati.
Controllare i progressi
La seguente immagine mostra il nuovo progetto.
Attività 2: creazione e addestramento del modello
Per avere un'anteprima di questo compito, guardate il video a partire da 00:08.
Ora che si dispone di un progetto, si è pronti a creare ed addestrare il modello utilizzando AutoAI. Seguire questi passi per creare l'esperimento AutoAI , esaminare le pipeline del modello e selezionare una pipeline da salvare come modello:
Clicca il Risorse scheda nel progetto, quindi fare clic su Nuova risorsa > Crea automaticamente modelli di machine learning .
Nella pagina Crea un esperimento AutoAI , completare i campi di base:
Fare clic sul pannello Esempio hub di risorse .
Selezionare Bank marketing sample datae fare clic su Next. Il nome e la descrizione del progetto verranno compilati per te.
Confermare che l'istanza del servizio watsonx.ai Runtime associata al progetto sia selezionata nel campo Istanza del serviziowatsonx.ai Runtime.
Fare clic su Crea.
In questo esperimento AutoAI di esempio, si vedrà che i Dati di esempio di marketing della banca sono già selezionati per l'esperimento.
Esaminare le impostazioni dell'esperimento preimpostato. In base al set di dati e alla colonna selezionata da prevedere, AutoAI analizza un sottoinsieme di dati e sceglie un tipo di previsione e una metrica da ottimizzare. In questo caso, il tipo di previsione è Classificazione binaria, la classe positiva è Sìe la metrica ottimizzata è ROC AUC & runtime.
Fai clic su Run experiment. Mentre il modello si allena, viene visualizzata un'infografica che mostra il processo di costruzione delle pipeline.
Per un elenco di algoritmi, o stimatori, disponibili con ciascuna tecnica di machine learning inAutoAI, Vedere:AutoAI dettaglio di implementazione .
Una volta completata l'esecuzione dell'esperimento, è possibile visualizzare e confrontare le pipeline classificate in una classifica.
È possibile fare clic su Confronto pipeline per visualizzare le differenze.
Fai clic sulla pipeline con il rango più alto per visualizzare i dettagli della pipeline.
Fare clic su Salva con nome, selezionare Modelloe fare clic su Crea. Salva la pipeline come modello nel progetto.
Una volta salvato il modello, fare clic su Visualizza nel progetto nella notifica per visualizzare il modello nel proprio progetto. In alternativa, è possibile passare alla scheda Asset nel progetto e fare clic sul nome del modello nella sezione Modelli .
Controllare i progressi
La seguente immagine mostra il modello.
Attività 3: promuovere il modello a uno spazio di distribuzione e distribuire il modello sottoposto a training
Per vedere un'anteprima di questo compito, guardate il video a partire da 04:57.
Prima di poter distribuire il modello, è necessario promuoverlo in uno spazio di distribuzione. Attieniti alla seguente procedura per promuovere il modello a uno spazio di distribuzione per distribuire il modello:
Fare clic sull'icona dello spazio di distribuzione " ".
Scegliere uno spazio di distribuzione esistente. Se non si dispone di uno spazio di distribuzione:
Fare clic su Crea un nuovo spazio di distribuzione.
Fornire un nome spazio e una descrizione facoltativa.
Selezionare un servizio di archiviazione.
Selezionare un servizio di machine learning.
Fare clic su Crea.
Fare clic su Chiudi.
Selezionare il nuovo spazio di distribuzione dall'elenco.
Seleziona l'opzione Vai al modello nello spazio dopo averlo promosso .
Fare clic su Promuovi.
Nota: se non hai selezionato l'opzione per andare al modello nello spazio dopo averlo promosso, puoi utilizzare il menu di navigazione per passare a Distribuzioni per selezionare il tuo modello e il tuo spazio di distribuzione.Con il modello aperto, fare clic su Nuova distribuzione.
Selezionare In linea come Tipo di distribuzione.
Specificare un nome per la distribuzione.
Fare clic su Crea.
Una volta completata la distribuzione, fare clic sul nome della distribuzione per visualizzare la pagina dei dettagli della distribuzione.
Controllare i progressi
La seguente immagine mostra la nuova distribuzione.
Attività 4: verificare il modello distribuito
Per vedere un'anteprima di questo compito, guardate il video a partire da 06:22.
Ora che il modello è stato distribuito, è possibile testarlo online utilizzando l'interfaccia utente o le API watsonx.ai Runtime. Attenersi alla seguente procedura per utilizzare l'interfaccia utente per verificare il modello con nuovi dati:
Fare clic sulla scheda Test . Puoi verificare il modello distribuito dalla pagina dei dettagli di distribuzione in due modi: test con un modulo o test con codice JSON.
Fare clic sulla scheda Input JSON , copiare i seguenti dati di test e incollarli per sostituire il testo JSON esistente:
{ "input_data": [ { "fields": [ "age", "job", "marital", "education", "default", "balance", "housing", "loan", "contact", "day", "month", "duration", "campaign", "pdays", "previous", "poutcome" ], "values": [ [ 27, "unemployed", "married", "primary", "no", 1787, "no", "no", "cellular", 19, "oct", 79, 1, -1, 0, "unknown" ] ] } ] }
Fare clic su Previsione per prevedere se è probabile che un cliente con gli attributi specificati si registri per un particolare tipo di account. La previsione risultante indica che questo cliente ha un'alta probabilità di non iscriversi alla promozione di marketing.
Fare clic sulla X per chiudere la finestra Risultati previsione .
Controllare i progressi
La seguente immagine mostra i risultati della verifica della distribuzione. I valori per la previsione potrebbero essere diversi dai valori nella seguente immagine.
Attività 5: creare un lavoro batch per calcolare il punteggio del modello
Dopo aver verificato il modello distribuito con una singola previsione, è possibile creare una distribuzione batch per calcolare più record contemporaneamente.
Attività 5a: configurare la distribuzione batch
Per avere un'anteprima di questo compito, guardate il video a partire da 07:00.
Per una distribuzione batch, fornire i dati di input, noti anche come payload del modello, in un file CSV. I dati devono essere strutturati come i dati di addestramento, con le stesse intestazioni di colonna. Il lavoro batch elabora ogni riga di dati e crea una previsione corrispondente. Seguire questa procedura per caricare i dati del payload nello spazio di distribuzione:
Copiare e incollare il seguente testo in un editor di testo e salvare il file come
bank-payload.csv
.age,job,marital,education,default,balance,housing,loan,contact,day,month,duration,campaign,pdays,previous,poutcome 30,unemployed,married,primary,no,1787,no,no,cellular,19,oct,79,1,-1,0,unknown 33,services,married,secondary,no,4789,yes,yes,cellular,11,may,220,1,339,4,failure 35,management,single,tertiary,no,1350,yes,no,cellular,16,apr,185,1,330,1,failure 30,management,married,tertiary,no,1476,yes,yes,unknown,3,jun,199,4,-1,0,unknown 59,blue-collar,married,secondary,no,0,yes,no,unknown,5,may,226,1,-1,0,unknown 35,management,single,tertiary,no,747,no,no,cellular,23,feb,141,2,176,3,failure 36,self-employed,married,tertiary,no,307,yes,no,cellular,14,may,341,1,330,2,other 39,technician,married,secondary,no,147,yes,no,cellular,6,may,151,2,-1,0,unknown 41,entrepreneur,married,tertiary,no,221,yes,no,unknown,14,may,57,2,-1,0,unknown 43,services,married,primary,no,-88,yes,yes,cellular,17,apr,313,1,147,2,failure 39,services,married,secondary,no,9374,yes,no,unknown,20,may,273,1,-1,0,unknown 43,admin.,married,secondary,no,264,yes,no,cellular,17,apr,113,2,-1,0,unknown 36,technician,married,tertiary,no,1109,no,no,cellular,13,aug,328,2,-1,0,unknown 20,student,single,secondary,no,502,no,no,cellular,30,apr,261,1,-1,0,unknown 31,blue-collar,married,secondary,no,360,yes,yes,cellular,29,jan,89,1,241,1,failure 40,management,married,tertiary,no,194,no,yes,cellular,29,aug,189,2,-1,0,unknown 56,technician,married,secondary,no,4073,no,no,cellular,27,aug,239,5,-1,0,unknown 37,admin.,single,tertiary,no,2317,yes,no,cellular,20,apr,114,1,152,2,failure 25,blue-collar,single,primary,no,-221,yes,no,unknown,23,may,250,1,-1,0,unknown 31,services,married,secondary,no,132,no,no,cellular,7,jul,148,1,152,1,other
Fai clic sullo spazio di distribuzione nella traccia di navigazione.
Fai clic sulla scheda Assets.
Trascinare il file bank-payload.csv nel pannello laterale e attendere il caricamento del file.
Controllare i progressi
La seguente immagine mostra la scheda Asset nello spazio di distribuzione.
Attività 5b: creare la distribuzione batch
Per avere un'anteprima di questo compito, guardate il video a partire da 07:30.
Per elaborare un batch di input e fare in modo che l'output venga scritto in un file invece che visualizzato in tempo reale, creare un lavoro di distribuzione batch.
Andare alla scheda Asset nello spazio di distribuzione.
Fate clic sul menu Overflow ' per il vostro modello e scegliete Deploy.
Per Tipo di distribuzione, selezionare Batch.
Immettere un nome per la distribuzione.
Scegliere la specifica hardware più piccola.
Fare clic su Crea.
Controllare i progressi
La seguente immagine mostra la distribuzione batch.
Attività 5c: creare il lavoro batch
Per vedere un'anteprima di questo compito, guardate il video a partire da 07:44.
Il lavoro batch esegue la distribuzione. Per creare il lavoro, specificare i dati di input e il nome per il file di emissione. È possibile impostare un lavoro da eseguire in base a una pianificazione oppure da eseguire immediatamente. Per creare un lavoro batch, attenersi alla seguente procedura:
Nella pagina di distribuzione, fare clic su Nuovo lavoro.
Specificare un nome per il lavoro e fare clic su Avanti.
Selezionare la specifica hardware più piccola e fare clic su Avanti.
Facoltativo: impostare una pianificazione e fare clic su Avanti.
Facoltativo: scegliere di ricevere le notifiche e fare clic su Avanti.
Sul pannello Scegli dati , selezionare i dati Input :
Fare clic su Seleziona origine dati.
Selezionare Asset dati> bank-payload.csv.
Fare clic su Conferma.
Tornare alla schermata Scegli dati , specificare il file Output :
Fare clic su Aggiungi.
Fare clic su Seleziona origine dati.
Verificare che la scheda Crea nuovo sia selezionata.
Per Nome, immettere
bank-output.csv
.Fare clic su Conferma.
Fare clic su Avanti per il passo finale.
Rivedere le impostazioni e fare clic su Crea ed esegui per eseguire il lavoro immediatamente.
Controllare i progressi
La seguente immagine mostra i dettagli del lavoro per la distribuzione batch
Attività 5d: Visualizzare l'output
Per avere un'anteprima di questo compito, guardate il video a partire da 08:42.
Seguire questa procedura per esaminare il file di emissione dal lavoro batch.
Fare clic sul nome del lavoro per visualizzare lo stato.
Quando lo stato viene modificato in Completato, fare clic sul nome dello spazio di distribuzione nella traccia di navigazione.
Fai clic sulla scheda Assets.
Fare clic sul file bank-output.csv per esaminare i risultati della previsione per le informazioni del cliente inoltrate per l'elaborazione batch. Per ogni caso, la previsione restituita a questi clienti è improbabile che si sottoscriva alla promozione della banca.
Controllare i progressi
La seguente immagine mostra i risultati del lavoro di distribuzione batch.
Passi successivi
Ora è possibile utilizzare questo dataset per ulteriori analisi. Ad esempio, l'utente o altri utenti possono eseguire una delle seguenti attività:
Ulteriori risorse
Prova questi tutorial aggiuntivi per acquisire maggiore esperienza pratica con la creazione di modelli utilizzandoAutoAI:
Provare questi altri metodi per creare modelli:
Visualizza altri video
Trovate set di dati di esempio per fare esperienza pratica nella costruzione di modelli nell'hub delle risorse
Argomento principale: Esercitazioni introduttive