Esercitazione Data Science and MLOps: Orchestrate una pipeline AI con monitoraggio del modello
Questa esercitazione consente di creare una pipeline end - to - end per fornire dati concisi, pre - elaborati e aggiornati memorizzati in un'origine dati esterna per il caso d'uso Data Science and MLOps. L'obiettivo è quello di utilizzare le pipeline di orchestrazione per orchestrare tale flusso di lavoro end-to-end per generare risultati automatizzati, coerenti e ripetibili. Il gasdotto utilizzaData Refinery EAutoAI, che automatizza diversi aspetti del processo di costruzione di un modello come l'ingegneria delle funzionalità e l'ottimizzazione degli iperparametri. AutoAI classifica gli algoritmi dei candidati e seleziona il modello migliore.
La storia del tutorial è che Golden Bank vuole espandere il suo business offrendo speciali rinnovi ipotecari a basso tasso per le applicazioni online. Le applicazioni online ampliano la portata dei clienti della banca e riducono i costi di elaborazione delle applicazioni. Per aiutare i finanziatori nel processo decisionale, il team utilizzerà Orchestration Pipelines per creare una pipeline di dati che fornisca dati aggiornati su tutti i richiedenti del mutuo. I dati vengono memorizzati in Db2 Warehouse. È necessario preparare i dati perché sono potenzialmente incompleti, obsoleti e potrebbero essere offuscati o completamente inaccessibili a causa della privacy dei dati e delle politiche di sovranità. Quindi, il team crea un modello di approvazione del mutuo da dati attendibili e distribuisce e verifica il modello in un ambiente di pre - produzione. Infine, il gruppo utilizza un blocco note per configurare i monitoraggi di Watson OpenScale , quindi valuta e osserva i monitoraggi in Watson OpenScale per assicurarsi che il modello trattasse in modo equo tutti gli aspiranti.
La seguente immagine animata fornisce una rapida anteprima di ciò che verrà realizzato entro la fine di questa esercitazione. Si modificherà ed eseguirà una pipeline per creare e distribuire un modello di machine learning, eseguire un notebook per configurare i monitor e convalidare il modello. Fare clic sull'immagine per visualizzare un'immagine più grande.
Anteprima dell'esercitazione
In questa esercitazione, verranno completate le seguenti attività:
- Impostare i requisiti.
- Attività 1: visualizzare gli asset nel progetto di esempio
- Attività 2: esplorazione di una pipeline esistente
- Attività 3: aggiungere un nodo alla pipeline.
- Attività 4: eseguire la pipeline.
- Attività 5: visualizzare gli asset, il modello distribuito e la distribuzione in linea
Se si desidera continuare a vedere come monitorare il modello utilizzando Watson OpenScale, completare le attività 6-10:
- Attività 6: eseguire il notebook per configurare i monitoraggi Watson OpenScale .
- Attività 7: valutare il modello.
- Attività 8: Osservare i monitor del modello per la qualità.
- Attività 9: osservare la correttezza dei monitor del modello.
- Attività 10: Osservare i monitor del modello per verificare l'esplicabilità.
- Eliminazione (facoltativo)
Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàCloud Pak for Data.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Imposta i requisiti
Registrati per Cloud Pak for Data as a Service
Devi registrarti per Cloud Pak for Data as a Service e fornire i servizi necessari per il caso di utilizzo dell'integrazione dei dati.
- Se hai un account Cloud Pak for Data as a Service esistente, puoi iniziare con questa esercitazione. Se hai un account del piano Lite, solo un utente per account può eseguire questa esercitazione.
- Se non hai ancora un account Cloud Pak for Data as a Service , allora registrati.
Verificare i servizi di cui è stato eseguito il provisioning necessari
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 00:00.
Attenersi alla seguente procedura per verificare o eseguire il provisioning dei servizi necessari:
Nel menu di navigazione Cloud Pak for Data , scegli Services> Service instances.
Utilizza l'elenco a discesa Prodotto per stabilire se esiste un'istanza del servizio Watson Studio esistente.
Se devi creare un'istanza del servizio Watson Studio , fai clic su Aggiungi servizio.
Selezionare Watson Studio.
Seleziona il piano Lite.
Fare clic su Crea.
Attendere che venga eseguito il provisioning del servizio Watson Studio , il cui completamento potrebbe richiedere alcuni minuti.
Ripetere questi passi per verificare o eseguire il provisioning dei seguenti servizi aggiuntivi:
- Watson Machine Learning
- Cloud Object Storage
- watsonx.governance - se si desidera monitorare il modello distribuito
Controlla i tuoi progressi
La seguente immagine mostra le istanze del servizio di cui è stato eseguito il provisioning:
Crea il progetto di esempio
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 01:27.
Se si dispone già del progetto di esempio per questa esercitazione, ignorare questa attività. In caso contrario, attenersi alla seguente procedura:
Accedere al progetto di esempio Data Science and MLOps nell'hub di risorse.
Fare clic su Crea progetto.
Se ti viene richiesto di associare il progetto a un'istanza Cloud Object Storage , seleziona un'istanza Cloud Object Storage dall'elenco.
Fare clic su Crea.
Attendere il completamento dell'importazione del progetto, quindi fare clic su Visualizza nuovo progetto per verificare che il progetto e gli asset siano stati creati correttamente.
Fare clic sulla scheda Asset per visualizzare gli asset per questa esercitazione.
Controlla i tuoi progressi
La seguente immagine mostra la scheda Asset del progetto di esempio. È ora possibile avviare l'esercitazione.
Associa al servizio Watson Machine Learning il progetto di esempio
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 02:17.
Utilizzerai Watson Machine Learning per creare e distribuire il modello, quindi attieniti alla seguente procedura per associare la tua istanza del servizio Watson Machine Learning al progetto di esempio.
Nel progetto Data Science and MLOps , fai clic sulla scheda Manage .
Fare clic su Servizi & Integrazioni .
Fare clic su Associa servizio.
Seleziona la casella accanto alla tua istanza del servizio Watson Machine Learning .
Fare clic su Associa.
Fare clic su Annulla per tornare alla pagina Servizi & Integrazioni .
Controlla i tuoi progressi
La seguente immagine mostra la pagina Services and Integrations con il servizio Watson Machine Learning elencato. Si è ora pronti a creare il progetto di esempio.
Attività 1: visualizzazione degli asset nel progetto di esempio
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 02:37.
Il progetto di esempio include diversi asset tra cui una connessione, una definizione dati, un flusso Data Refinery e una pipeline. Attenersi alla seguente procedura per visualizzare tali asset:
Fare clic sulla scheda Asset nel progetto Data Science and MLOps , quindi visualizzare Tutti gli asset.
Visualizzare l'elenco di asset di dati utilizzati nel flusso Data Refinery e nella pipeline. Questi asset sono memorizzati in una connessione Data Fabric di prova - Db2 Warehouse nello schema AI_MORTGAGE . Fare clic su Importa asset, quindi passare alla versione di prova di Data Fabric - Db2 Warehouse > AI_MORTGAGE. La seguente immagine mostra gli asset da tale connessione:
Il flusso Mortgage Age_Data_Approvals_flow Data Refinery integra i dati relativi a ciascun richiedente del mutuo. I dati integrati includono informazioni di identificazione personale, con i relativi dettagli dell'applicazione, i punteggi di credito, lo status di acquirente commerciale e, infine, i prezzi di ogni casa scelta del richiedente. Il flusso crea quindi un file sequenziale con il nome
Mortgage_Data_with_Approvals_DS.csv
nel progetto contenente i dati uniti. La seguente immagine mostra il flusso Mortgage Data_Approvals_flow Data Refinery :
Controlla i tuoi progressi
La seguente immagine mostra tutti gli asset nel progetto di esempio. Ora è possibile esplorare la pipeline nel progetto di esempio
Attività 2: esplorazione di una pipeline esistente
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 03:00.
Il progetto di esempio include una pipeline di orchestrazione, che automatizza le seguenti attività:
Eseguire un lavoro Data Refinery esistente.
Creare un esperimento AutoAI .
Eseguire l'esperimento AutoAI e salvare il modello con le prestazioni migliori che utilizza il file di output risultante dal lavoro Data Refinery come dati di addestramento.
Creare un spazio di distribuzione.
Promuovere il modello salvato allo spazio di distribuzione.
Seguire questa procedura per esplorare la pipeline:
Dalla scheda Asset nel progetto Data Science and MLOps , visualizzare Tutti gli asset.
Fare clic su Pipeline di approvazione del mutuo - Data Science per aprire la pipeline.
Fare doppio clic sul lavoro Integra dati di approvazione del mutuo Data Refinery , che combina diverse tabelle dalla connessione Db2 Warehouse on Cloud in un dataset con etichetta coesa utilizzato come dati di addestramento per l'esperimento AutoAI . Fare clic su Annulla per tornare alla pipeline.
Fare clic sulla condizione Verifica stato e scegliere Modifica. Questa condizione è un punto di decisione nella pipeline per confermare il completamento del lavoro Data Refinery con un valore di Completato o Completato con avvertenze. Fare clic su Annulla per tornare alla pipeline.
Fare doppio clic sul nodo Crea esperimento AutoAI per visualizzare le impostazioni. Questo nodo crea un esperimento AutoAI con le impostazioni.
Rivedere i valori per le seguenti impostazioni:
Nome esperimento AutoAI
Ambito
Tipo di previsione
Colonna previsione
Classe positiva
Rapporto di suddivisione dei dati di addestramento
Algoritmi da includere
Algoritmi da utilizzare
Ottimizza metrica
Fare clic su Annulla per chiudere le impostazioni.
Fare doppio clic sul nodo Esegui esperimento AutoAI per visualizzare le impostazioni. Questo nodo esegue l'esperimento AutoAI creato dal nodo Crea esperimento AutoAI che utilizza l'output del lavoro Integra approvazione mutuo Data Refinery come dati di addestramento.
Rivedere i valori per le seguenti impostazioni:
Esperimento AutoAI
Asset dei dati di addestramento
Prefisso nome modello
Fare clic su Annulla per chiudere le impostazioni.
Tra i nodi Esegui esperimento AutoAI e Crea spazio di distribuzione , fare clic su Si desidera distribuire il modello? e scegliere Modifica. Il valore Vero per questa condizione è un punto di decisione nella pipeline per continuare a creare lo spazio di distribuzione. Fare clic su Annulla per tornare alla pipeline.
Fare doppio clic sul nodo Crea spazio di distribuzione per aggiornare le impostazioni. Questo nodo crea un nuovo spazio di installazione con il nome specificato e richiede l'input per i tuoi servizi Cloud Object Storage e Watson Machine Learning .
Rivedi il valore per l'impostazione Nuovo nome spazio .
Per il campo Nuovo CRN istanza COS spazio , seleziona la tua istanza Cloud Object Storage dall'elenco.
Per il campo New space WML Instance CRN , selezionare l'istanza Watson Machine Learning dall'elenco.
Fare clic su Salva.
Fare doppio clic sul nodo Promuovi modello nello spazio di distribuzione per visualizzare le impostazioni. Questo nodo promuove il modello migliore dal nodo Esegui esperimento AutoAI allo spazio di distribuzione creato dal nodo Crea spazio di distribuzione .
Rivedere i valori per le seguenti impostazioni:
Asset origine
Obiettivo
Fare clic su Annulla per chiudere le impostazioni.
Controlla i tuoi progressi
La seguente immagine mostra la pipeline iniziale. Si è ora pronti a modificare la pipeline per aggiungere un nodo.
Attività 3: aggiungere un nodo alla pipeline
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 05:41.
La pipeline crea il modello, crea uno spazio di distribuzione e quindi lo promuove a uno spazio di distribuzione. È necessario aggiungere un nodo per creare una distribuzione in linea. Seguire questa procedura per modificare la pipeline per automatizzare la creazione di una distribuzione online:
Aggiungere il nodo Crea distribuzione in linea all'area di disegno:
Espandere la sezione Crea nella tavolozza dei nodi.
Trascinare il nodo Crea distribuzione online nell'area e rilasciare il nodo dopo il nodo Promuovi modello a spazio di distribuzione .
Passare con il mouse sul nodo Promuovi modello a spazio di distribuzione per visualizzare la freccia. Collegare la freccia al nodo Crea distribuzione in linea .
Nota: i nomi dei nodi nella tua pipeline potrebbero essere diversi dalla seguente immagine animata.Connettere il commento Crea distribuzione online per il modello promosso al nodo Crea distribuzione in linea collegando il cerchio nella casella del commento al nodo.
Nota: i nomi dei nodi nella tua pipeline potrebbero essere diversi dalla seguente immagine animata.Fare doppio clic su Crea distribuzione in linea per visualizzare le impostazioni.
Modificare il nome nodo in
Create Online Deployment
.Accanto a Asset ML, fare clic su Seleziona da un altro nodo dal menu.
Selezionare il nodo Promuovi modello a spazio di distribuzione dall'elenco. L'ID nodo winning_model è selezionato.
Per il Nuovo nome distribuzione, immettere
Mortgage approval model deployment - Data Science
.Per Modalità creazione, selezionare Sovrascrivi.
Fare clic su Salva per salvare le impostazioni del nodo Crea distribuzione in linea .
Controlla i tuoi progressi
La seguente immagine mostra la pipeline completata. Sei ora pronto per eseguire la pipeline.
Attività 4: esecuzione della pipeline
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 06:57.
Ora che la pipeline è completa, segui questi passi per eseguire la pipeline:
Dalla barra degli strumenti, fai clic su Run pipeline> Trial run.
Nella pagina Definisci parametri pipeline , selezionare True per la distribuzione.
Se è impostato su True, la pipeline verifica il modello distribuito e calcola il punteggio del modello.
Se impostato su False, la pipeline verifica che il modello sia stato creato nel progetto dall'esperimento AutoAI e riesamina le informazioni sul modello e le metriche di addestramento.
Fornire una chiave API se questa occasione è la prima volta che si esegue una pipeline. Gli asset pipeline utilizzano la tua chiave API IBM Cloud personale per eseguire le operazioni in modo sicuro senza interruzioni.
Se hai una chiave API esistente, fai clic su Utilizza chiave API esistente, incolla la chiave API e fai clic su Salva.
Se non hai una chiave API esistente, fai clic su Genera nuova chiave API, fornisci un nome e fai clic su Salva. Copia la chiave API e salva la chiave API per un utilizzo futuro. Al termine, fare clic su Chiudi.
Fare clic su Esegui per avviare l'esecuzione della pipeline.
Monitorare l'avanzamento della pipeline.
Scorrere i log consolidati durante l'esecuzione della pipeline. Il completamento dell'esecuzione di prova potrebbe richiedere fino a 10 minuti.
Al termine di ciascuna operazione, selezionare il nodo per tale operazione nell'area.
Sulla scheda Node Inspector , visualizzare i dettagli dell'operazione.
Fare clic sulla scheda Output nodo per visualizzare un riepilogo dell'output per ciascuna operazione del nodo.
Controlla i tuoi progressi
La seguente immagine mostra la pipeline dopo aver completato l'esecuzione di prova. Si è ora pronti a esaminare gli asset creati dalla pipeline.
Attività 5: visualizzare gli asset, il modello distribuito e la distribuzione in linea
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 08:58.
La pipeline ha creato diversi asset. Seguire questi passi per visualizzare gli asset:
Fare clic su Data Science and MLOps nel percorso di navigazione per tornare al progetto.
Sulla scheda Asset , visualizzare Tutti gli asset.
Visualizzare gli asset di dati.
Fare clic sull'asset di dati Mortgage_Data_with_Approvals_DS.csv . Il lavoro Data Refinery ha creato questo asset.
Fare clic sul nome progetto Data Science and MLOps nella traccia di navigazione per tornare alla scheda Asset .
Visualizzare il modello.
Fare clic sull'asset del modello di machine learning che inizia con ds_mortgage _approval_best_model. L'esperimento AutoAI ha generato diversi candidati del modello e lo ha scelto come modello migliore. Salvare questo nome modello in un file di testo. Il nome del modello è richiesto per configurare i monitoraggi Watson OpenScale nell'attività successiva.
Scorrere le informazioni sul modello.
Fare clic sul nome progetto Data Science and MLOps nella traccia di navigazione per tornare alla scheda Asset .
Fare clic sulla scheda Lavori nel progetto per visualizzare le informazioni sui lavori Data Refinery e Pipeline.
Apri lo spazio di distribuzione che hai creato con la pipeline.
Dal Cloud Pak for Data , scegli Deployments.
Fare clic sulla scheda Spazi .
Fare clic sullo spazio di distribuzione Approvazione mutuo - Data Science and MLOps .
Fare clic sulla scheda Asset e visualizzare il modello distribuito che inizia con ds_mortgage age_approval_best_model.
Fare clic sulla scheda Distribuzioni .
Fai clic su Distribuzione del modello di approvazione del mutuo - Data Science per visualizzare la distribuzione.
Nella scheda Riferimento API , visualizza l'endpoint API e i frammenti di codice.
Fare clic sulla scheda Test .
Fai clic sulla scheda JSON input e sostituisci il testo di esempio con il seguente testo JSON.
{ "input_data": [ { "fields": [ "ID", "NAME", "STREET_ADDRESS", "CITY", "STATE", "STATE_CODE", "ZIP_CODE", "EMAIL_ADDRESS", "PHONE_NUMBER", "GENDER", "SOCIAL_SECURITY_NUMBER", "EDUCATION", "EMPLOYMENT_STATUS", "MARITAL_STATUS", "INCOME", "APPLIEDONLINE", "RESIDENCE", "YRS_AT_CURRENT_ADDRESS", "YRS_WITH_CURRENT_EMPLOYER", "NUMBER_OF_CARDS", "CREDITCARD_DEBT", "LOANS", "LOAN_AMOUNT", "CREDIT_SCORE", "CRM_ID", "COMMERCIAL_CLIENT", "COMM_FRAUD_INV", "FORM_ID", "PROPERTY_CITY", "PROPERTY_STATE", "PROPERTY_VALUE", "AVG_PRICE" ], "values": [ [ null, null, null, null, null, null, null, null, null, null, null, "Bachelor", "Employed", null, 144306, null, "Owner Occupier", 15, 19, 2, 7995, 1, 1483220, 437, null, false, false, null, null, null, 111563, null ], [ null, null, null, null, null, null, null, null, null, null, null, "High School", "Employed", null, 45283, null, "Private Renting", 11, 13, 1, 1232, 1, 7638, 706, null, false, false, null, null, null, 54262, null ] ] } ] }
Fare clic su Previsione. I risultati mostrano che il primo richiedente non sarà approvato e il secondo sarà approvato.
Controlla i tuoi progressi
La seguente immagine mostra i risultati del test. I punteggi di confidenza per il tuo test potrebbero essere diversi dai punteggi mostrati nell'immagine.
Attività 6: eseguire il notebook per configurare i monitoraggi Watson OpenScale
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 10:40.
Ora è possibile eseguire il notebook incluso nel progetto di esempio. Il notebook include il codice per:
- Recuperare il modello e le distribuzioni.
- Configurare Watson OpenScale.
- Creare il fornitore del servizio e la sottoscrizione per il proprio servizio di machine learning.
- Configurare il monitor qualità.
- Configurare il monitoraggio della correttezza.
- Configurare l'esplicabilità.
Seguire questa procedura per eseguire il notebook incluso nel progetto di esempio. Prendere un po 'di tempo per leggere i commenti nel notebook, che spiegano il codice in ogni cella.
Dal menu di navigazione Cloud Pak for Data , scegli Progetti> Visualizza tutti i progetti.
Fare clic sul nome progetto Data Science and MLOps .
Fare clic sulla scheda Asset , quindi passare a Notebook.
Apri il notebook monitor - wml - model - with - watson - openscale - pipeline .
Fare clic sull'icona Modifica per posizionare il notebook in modalità di modifica.
Quando si importa un progetto dall'hub di risorse, la prima cella del notebook contiene il token di accesso al progetto. Se questo notebook non contiene una prima cella con un token di accesso al progetto, è necessario generare il token. Dal menu Altro , selezionare Inserisci token progetto. Questa azione inserisce una nuova cella come prima cella nel notebook contenente il token del progetto.
Fornisci la tua chiave API nella sezione Fornisci la tua chiave API IBM Cloud . È necessario passare le credenziali all'API Watson Machine Learning utilizzando una chiave API. Se non disponi già di una chiave API salvata, attieniti a questa procedura per creare una chiave API.
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 04:55.Accedi alla pagina delle chiavi API della consoleIBM Cloud.
Fai clic su Crea una chiave API IBM Cloud. Se hai delle chiavi API esistenti, il pulsante può essere etichettato come Crea.
Immettere un nome e una descrizione.
Fare clic su Crea.
Copia la chiave API.
Scarica la chiave API per un utilizzo futuro.
Torna al notebook e incolla la chiave API nel campo ibmcloud_api_key .
Nella sezione 3. Modello e distribuzione, per la variabile nome_modello , incollare il nome del modello salvato in un file di testo nell'attività precedente. space_name e deployment_name vengono compilati utilizzando i nomi specificati nella pipeline.
Fare clic su Cella> Esegui tutto per eseguire tutte le celle nel notebook. In alternativa, fare clic sull'icona Esegui per eseguire il notebook cella per cella per esplorare ciascuna cella e il relativo output.
Monitorare la cella di avanzamento per cella, notando l'asterisco "In [
*
]" che cambia in un numero, ad esempio "In [1
]". Il completamento del notebook richiede da 1 a 3 minuti.Provare questi suggerimenti se si verificano errori durante l'esecuzione del notebook:
- Fare clic su Kernel> Restart & Clear Output per riavviare il kernel, quindi eseguire nuovamente il notebook.
- Verificare di aver copiato e incollato il nome della distribuzione esattamente senza spazi iniziali o finali.
Controlla i tuoi progressi
La seguente immagine mostra il notebook quando l'esecuzione è completa. Il notebook ha salvato il modello nel progetto, quindi ora si è pronti a valutare il modello.
Attività 7: valutare il modello
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 13:35.
Segui questa procedura per valutare il modello in Watson OpenScale:
Fare clic sul progetto Data Science and MLOps nella traccia di navigazione.
Nella scheda Asset , espandere il tipo di asset Dati e fare clic su Asset dati.
Fare clic sul menu Overflow per l'asset di dati mortgage_sample_test_data.csv e scegliere Download. Per convalidare che il modello funziona come richiesto, hai bisogno di una serie di dati con etichetta, che è stata trattenuta dall'addestramento del modello. Questo file CSV contiene tali dati di controllo.
Avvia Watson OpenScale.
Dal menu di navigazione Cloud Pak for Data , scegli Servizi> Istanze del servizio.
Fare clic sul nome dell'istanza Watson OpenScale . Se richiesto, accedi utilizzando le stesse credenziali che hai utilizzato per registrarti a Cloud Pak for Data.
Nella pagina dell'istanza del servizio Watson OpenScale , fai clic su Avvia applicazione.
Nel dashboard Insights, fai clic su Distribuzione del modello di approvazione del mutuo - Data Science .
Dal menu Azioni , selezionare Valuta ora.
Dall'elenco di opzioni di importazione, selezionare dal file CSV.
Trascinare il file di dati mortgage_sample_test_data.csv scaricato dal progetto nel pannello laterale.
Fare clic su Carica e valuta. Il completamento della valutazione potrebbe richiedere diversi minuti.
Controlla i tuoi progressi
La seguente immagine mostra il risultato della valutazione per il modello distribuito in Watson OpenScale. Una volta valutato il modello, è possibile osservare la qualità del modello.
Attività 8: Osservare i monitor del modello per la qualità
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 14:00.
Il monitor della qualità Watson OpenScale genera una serie di metriche per valutare la qualità del proprio modello. È possibile utilizzare queste metriche di qualità per determinare in che modo il modello prevede i risultati. Quando la valutazione che utilizza i dati di holdout viene completata, attenersi alla seguente procedura per osservare la qualità o l'accuratezza del modello:
Nel pannello di navigazione a sinistra, fai clic sull'icona Dashboard Insights .
Individuare il riquadro Distribuzione del modello di approvazione del mutuo - Data Science . Si noti che la distribuzione ha 0 problemi e che entrambi i test Qualità e Correttezza non hanno generato alcun errore, il che significa che il modello ha soddisfatto le soglie richieste.
Nota: potrebbe essere necessario aggiornare il dashboard per visualizzare gli aggiornamenti dopo la valutazione.Fare clic sul riquadro Distribuzione del modello di approvazione del mutuo - Data Science per visualizzare ulteriori dettagli.
Nella sezione Qualità , fare clic sull'icona Configura . Qui puoi vedere che la soglia di qualità configurata per questo monitor è del 70% e che la misura della qualità utilizzata è un'area sotto la curva ROC.
Fare clic su Vai al riepilogo del modello per tornare alla finestra dei dettagli del modello.
Nella sezione Qualità , fare clic sull'icona Dettagli per visualizzare i risultati dettagliati della qualità del modello. Qui è possibile vedere un certo numero di calcoli di metrica di qualità e una matrice di confusione che mostra le decisioni del modello corrette insieme a falsi positivi e falsi negativi. L'area calcolata sotto la curva ROC è 0.9 o superiore, che supera la soglia 0.7 , quindi il modello soddisfa i requisiti di qualità.
Fare clic su Distribuzione del modello di approvazione del mutuo - Data Science nel percorso di navigazione per tornare al pannello dei dettagli del modello.
Controlla i tuoi progressi
La seguente immagine mostra i dettagli della qualità in Watson OpenScale. I punteggi di qualità possono variare. Dopo aver osservato la qualità del modello, è possibile osservare la correttezza del modello.
Attività 9: Osservare i monitor del modello per la correttezza
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 15:59.
Il monitor della correttezza Watson OpenScale genera una serie di metriche per valutare la correttezza del tuo modello. È possibile utilizzare le metriche di correttezza per stabilire se il proprio modello produce risultati distorti. Attenersi alla seguente procedura per osservare la correttezza del modello:
Nella sezione Correttezza , fare clic su Configura . Qui si vede che il modello è in fase di revisione per garantire che i candidati siano trattati in modo equo indipendentemente dal loro sesso. Le donne sono identificate come il gruppo monitorato per il quale viene misurata la correttezza, e la soglia per la correttezza deve essere almeno dell ' 80%. Il monitor di correttezza utilizza il metodo di impatto disparato per determinare la correttezza. L'impatto disparato confronta la percentuale di risultati favorevoli per un gruppo monitorato con la percentuale di risultati favorevoli per un gruppo di riferimento.
Fare clic su Vai al riepilogo del modello per tornare alla schermata dei dettagli del modello,
Nella sezione Correttezza , fare clic sull'icona Dettagli per visualizzare i risultati dettagliati della correttezza del modello. Qui viene visualizzata la percentuale di candidati di sesso maschile e femminile che vengono approvati automaticamente, insieme a un punteggio di correttezza di circa il 100%, quindi le prestazioni del modello superano di gran lunga la soglia di correttezza dell ' 80% richiesta.
Notare i dataset identificati nell'elenco Dataset . Per garantire che le metriche di correttezza siano più accurate, Watson OpenScale utilizza la perturbazione per determinare i risultati in cui vengono modificati solo gli attributi protetti e gli input del modello correlati, mentre le altre funzioni rimangono le stesse. La perturbazione modifica i valori della funzione dal gruppo di riferimento al gruppo monitorato o viceversa. Questi guardrail aggiuntivi vengono utilizzati per calcolare la correttezza quando viene utilizzato il dataset "bilanciato", ma è anche possibile visualizzare i risultati della correttezza utilizzando solo i dati di addestramento del modello o del payload. Poiché il modello si comporta correttamente, non è necessario entrare in ulteriori dettagli per questa metrica.
Fare clic sul percorso di navigazione Distribuzione del modello di approvazione del mutuo - Data Science per tornare alla schermata dei dettagli del modello.
Controlla i tuoi progressi
La seguente immagine mostra i dettagli di correttezza in Watson OpenScale. Ora che hai osservato la correttezza del modello, puoi osservare l'esplicabilità del modello.
Attività 10: Osservare i monitoraggi del modello per l'esplicabilità
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 17:42.
È necessario capire come il modello è arrivato alla sua decisione. Questa comprensione è necessaria sia per spiegare le decisioni alle persone coinvolte nell'approvazione del mutuo sia per garantire ai proprietari del modello che le decisioni siano valide. Per comprendere queste decisioni, attenersi alla seguente procedura per osservare l'esplicabilità del modello:
Nel pannello di navigazione a sinistra, fare clic sull'icona Spiega una transazione .
Seleziona Distribuzione del modello di approvazione mutuo - Data Science per visualizzare un elenco di transazioni.
Per qualsiasi transazione, fare clic su Spiega nella colonna Azioni . Qui vedete la spiegazione dettagliata di questa decisione. Verranno visualizzati gli input più importanti per il modello e l'importanza di ciascuno per il risultato finale. Le barre blu rappresentano gli input che tendono a supportare la decisione del modello mentre le barre rosse mostrano gli input che potrebbero aver portato a un'altra decisione. Ad esempio, un richiedente potrebbe avere un reddito sufficiente per essere altrimenti approvato, ma la sua storia di credito scadente e il debito elevato insieme portano il modello a rifiutare la domanda. Esaminare questa spiegazione per essere soddisfatti della base della decisione del modello.
Facoltativo: se si desidera approfondire il modo in cui il modello ha preso la sua decisione, fare clic sulla scheda Ispeziona . Utilizzare la funzione Ispeziona per analizzare la decisione di trovare aree di sensibilità in cui piccole modifiche a pochi input risulterebbero in una decisione diversa. È possibile testare la sensibilità da soli sovrascrivendo alcuni degli input effettivi con alternative per vedere se questi influiscono sul risultato.
Controlla i tuoi progressi
La seguente immagine mostra l'esplicabilità di una transazione in Watson OpenScale. È stato stabilito che il modello è accurato e che tutti i candidati vengono trattati in modo equo. Ora, è possibile avanzare il modello alla fase successiva nel suo ciclo di vita.
Il team di Golden Bank ha utilizzato Orchestration Pipelines per creare una pipeline di dati che fornisce dati aggiornati su tutti i richiedenti di mutui e un modello di machine learning che i prestatori possono utilizzare per il processo decisionale. Quindi, il team ha utilizzato Watson OpenScale per garantire che il modello trattasse tutti i candidati in modo equo.
Ripulitura (facoltativo)
Se si desidera riprendere questa esercitazione, eliminare le seguenti risorse utente.
Risorse utente | Come eliminare |
---|---|
Distribuzione del modello di approvazione del mutuo - Data Science nello spazio di distribuzione Data Science and MLOps | Elimina una distribuzione |
Approvazione del mutuo - Data Science e MLOps spazio di implementazione | Elimina uno spazio di distribuzione |
Progetto di esempio Data Science e MLOps | Eliminare un progetto |
Passi successivi
Prova queste esercitazioni:
Registrati per un altro caso di utilizzo.
Ulteriori informazioni
Argomento principale: Esercitazioni del caso d'uso