0 / 0
Torna alla versione inglese della documentazione
Introduzione rapida: valutare un modello di machine learning
Ultimo aggiornamento: 28 nov 2024
Introduzione rapida: valutare un modello di machine learning

Seguire questa esercitazione per scoprire come valutare un modello che prevede quali candidati si qualificano per i mutui. È necessario valutare il modello per la qualità, la correttezza e l'esplicabilità.

Servizi richiesti
watsonx.ai
watsonx.governance

Il flusso di lavoro di base include le seguenti attività:

  1. Aprire un progetto. I progetti sono dove è possibile collaborare con altri per lavorare con dati e modelli.
  2. Creare un modello. È possibile creare un modello utilizzando uno dei seguenti metodi:
    • Crea un notebook Jupyter e aggiungi il codice Python .
    • Creare un esperimento AutoAI .
  3. Distribuisci il tuo modello.
  4. Configurare i monitor Watson OpenScale utilizzando uno dei seguenti metodi:
    • Creare un notebook Jupyter.
    • Aggiungi la distribuzione al dashboard Watson OpenScale utilizzando l'IU.

Leggi Watson OpenScale

Watson OpenScale tiene traccia e misura dei risultati dei tuoi modelli di intelligenza artificiale e aiuta a garantire che rimangano equi, spiegabili e conformi, indipendentemente da dove i tuoi modelli sono stati creati o sono in esecuzione. Watson OpenScale rileva e aiuta a correggere la deviazione nell'accuratezza quando un modello AI è in produzione.

Ulteriori informazioni su Watson OpenScale

Guarda un video sulla valutazione di un modello di machine learning

Guarda il video Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.


Prova un'esercitazione sulla valutazione di un modello di machine learning

In questa esercitazione, verranno completate le seguenti attività:





Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se si ha bisogno di aiuto con questa esercitazione, è possibile porre una domanda o trovare una risposta nella sezione 'watsonx Forum di discussione della comunità.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Attività 1: creare un progetto di esempio

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 00:06.

Questa esercitazione usa un progetto di esempio contenente un modello di machine learning e un notebook per configurare i monitor. Seguire questa procedura per creare un progetto basato su un esempio.

  1. Accedere al progetto di esempio Evaluate an ML model nell'hub Risorse.

  2. Fare clic su Crea progetto.

  3. Se ti viene richiesto di associare il progetto a un'istanza Cloud Object Storage , seleziona un'istanza Cloud Object Storage dall'elenco.

  4. Fare clic su Crea.

  5. Attendere il completamento dell'importazione del progetto, quindi fare clic su Visualizza nuovo progetto per verificare che il progetto e gli asset siano stati creati correttamente.

  6. Fare clic sulla scheda Asset per visualizzare gli asset nel progetto di esempio.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra il progetto di esempio. È ora possibile avviare l'esercitazione.

Progetto di esempio




Attività 2: distribuire il modello

Prima di poter distribuire il modello, è necessario promuovere il modello a un nuovo spazio di distribuzione. Gli spazi di distribuzione consentono di organizzare le risorse di supporto come i dati di input e gli ambienti, di distribuire modelli o funzioni per generare previsioni o soluzioni e di visualizzare o modificare i dettagli di distribuzione.

Attività 2a: promuovere il modello a uno spazio di distribuzione

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 00:49.

Attenersi alla seguente procedura per promuovere il modello in un nuovo spazio di distribuzione:

  1. Nella scheda Asset , fare clic su Modello di previsione approvazione mutuo per visualizzare il modello.

  2. Nella pagina del modello, fare clic sull'icona dello spazio di distribuzione " Promuovi nello spazio di distribuzione".

  3. Per Spazio di destinazione, selezionare Crea un nuovo spazio di distribuzione.

    1. Per il nome dello spazio di distribuzione, copiare e incollare il nome esattamente come mostrato, senza spazi iniziali o finali: Golden Bank Preproduction Space

    2. Selezionare un servizio di archiviazione dall'elenco.

    3. Selezionare il servizio di machine learning di cui è stato eseguito il provisioning dall'elenco.

    4. Fare clic su Crea.

    5. Fare clic su Chiudi.

  4. Per lo Spazio di destinazione, accertarsi che sia selezionato Spazio di preproduzione Golden Bank .

  5. Selezionare l'opzione Vai al modello nello spazio dopo averlo promosso .

  6. Fare clic su Promuovi.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra il modello nello spazio di distribuzione. Si è ora pronti a creare una distribuzione modello.

Modello nello spazio di distribuzione

Attività 2b: creare una distribuzione online per il modello

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 01:30.

Attenersi alla seguente procedura per creare una distribuzione in linea per il modello:

  1. Quando viene aperto lo spazio di distribuzione, fare clic su Nuova distribuzione.

    1. Per il Tipo di distribuzione, selezionare Online.

    2. Per il Nome, copiare e incollare il nome dell'installazione client esattamente come mostrato, senza spazi iniziali o finali: Mortgage Approval Model Deployment

    3. Fare clic su Crea.

  2. Attendere il completamento della distribuzione del modello. Quando il modello viene distribuito correttamente, visualizzare la distribuzione per visualizzare l'endpoint di calcolo del punteggio e, facoltativamente, verificare il modello.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la distribuzione del modello. È ora possibile eseguire il notebook per configurare i monitor.

Implementazione del modello




Attività 3: eseguire il notebook per configurare i monitor

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 01:55.


Eseguire il notebook incluso nel progetto di esempio per:

  • Recuperare il modello e le distribuzioni.
  • Configurare Watson OpenScale.
  • Creare il fornitore del servizio e la sottoscrizione per il proprio servizio di machine learning.
  • Configurare il monitor qualità.
  • Configurare il monitoraggio della correttezza.
  • Configurare l'esplicabilità.

Seguire questa procedura per eseguire il notebook incluso nel progetto di esempio. Questo notebook imposta i monitor per il modello, che possono essere configurati anche tramite l'interfaccia utente. Tuttavia, è più veloce e meno incline agli errori impostarli con un notebook. Prendere un po 'di tempo per leggere i commenti nel notebook, che spiegano il codice in ogni cella.

  1. Dal menu di navigazione 'Menu di navigazione, scegliere Progetti > Visualizza tutti i progetti.

  2. Aprire il progetto Valuta un modello ML .

  3. Fare clic sulla scheda Attività, quindi spostarsi su Taccuini.
    'Barra di spostamento a sinistra

  4. Apri il notebook monitor - wml - model - with - watson - openscale .

  5. Poiché il blocco note è in modalità di sola lettura, fare clic sull'icona Modifica 'Modifica per mettere il blocco note in modalità di modifica.

  6. Quando si è importato il progetto dall'hub di risorse, la prima cella di questo blocco note contiene il token di accesso del progetto. Se questo notebook non contiene una prima cella con un token di accesso al progetto, quindi per generare il token, dal menu Altro , selezionare Inserisci token del progetto. Questa azione inserisce una nuova cella come prima cella nel notebook contenente il token del progetto.

  7. Nella sezione Fornisci la tua chiave API IBM Cloud, è necessario passare le proprie credenziali all'API watsonx.ai Runtime utilizzando una chiave API. Se non disponi già di una chiave API salvata, attieniti a questa procedura per creare una chiave API.

    1. Accedere alla pagina delle chiavi API della consoleIBM Cloud.

    2. Fai clic su Crea una chiave API IBM Cloud. Se hai delle chiavi API esistenti, il pulsante può essere etichettato come Crea.

    3. Immettere un nome e una descrizione.

    4. Fare clic su Crea.

    5. Copia la chiave API.

    6. Scarica la chiave API per un utilizzo futuro.

    7. Torna al notebook e incolla la chiave API nel campo ibmcloud_api_key .

  8. In 3. Sezione Modello e distribuzione , verificare i valori assegnati alle variabili space_name, model_namee deployment_name .

  9. Fare clic su Cella> Esegui tutto per eseguire tutte le celle nel notebook. In alternativa, fare clic sull'icona Esegui 'Esegui accanto a ciascuna cella per eseguire il blocco note cella per cella ed esplorare ciascuna cella e il relativo risultato.

  10. Il completamento del notebook richiede da 1 a 3 minuti. È possibile controllare la cella di avanzamento per cella notando l'asterisco "In [*]" che cambia in un numero, ad esempio "In [1]".

  11. Se si verificano degli errori durante l'esecuzione del notebook, provare i seguenti suggerimenti per la risoluzione dei problemi:

    • Fare clic su Kernel> Restart & Clear Output per riavviare il kernel, quindi eseguire nuovamente il notebook.

    • Elimina eventuali distribuzioni Watson OpenScale esistenti ed esegui il provisioning di una nuova istanza del servizio.

    • Verificare di aver creato lo spazio di distribuzione e il nome della distribuzione copiando e incollando il nome della risorsa specificato esattamente senza spazi iniziali o finali.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra il notebook quando l'esecuzione è completa. Il notebook configura i monitoraggi per il tuo modello, quindi puoi ora visualizzare la distribuzione in Watson OpenScale.

Esecuzione notebook completata




Attività 4: valutare il modello

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 03:35.

Segui questa procedura per scaricare i dati di holdout e utilizzali per valutare il modello in Watson OpenScale:

  1. Fare clic sul progetto Valuta un modello ML nella traccia di navigazione.

    Traccia di navigazione

  2. Sulla scheda Asset , fare clic su Dati> Asset dati.

  3. Fare clic sul menu Overflow 'Menu di overflow per la risorsa dati GoldenBank_HoldoutData.csv e scegliere Download. Per convalidare che il modello funziona come richiesto, hai bisogno di una serie di dati con etichetta, che sono stati tenuti fuori dalla formazione del modello. Questo file CSV contiene i dati di controllo.

  4. Avvia Watson OpenScale.

    1. Dal menu di navigazione 'Menu di navigazione, scegliere Servizi > Istanze di servizio.

    2. Fare clic sull'istanza Watson OpenScale per aprire la pagina dell'istanza del servizio. Se richiesto, accedi utilizzando le stesse credenziali che hai utilizzato per registrarti a Cloud Pak for Data.

      Nota:La tua istanza può avere un nome differente, come ad esempio `watsonx.governance-xx`.
    3. Nella pagina dell'istanza del servizio Watson OpenScale , fai clic su Launch Watson OpenScale.

  5. Nel dashboard Insights, fai clic sul tile Mortgage Approval Model Deployment .

  6. Dal menu Azioni , selezionare Valuta ora.

  7. Dall'elenco di opzioni di importazione, selezionare dal file CSV.

  8. Trascinate il file Golden Bank_HoldoutData.csv scaricato dal progetto nel pannello laterale.

  9. Fare clic su Carica e valuta e attendere il completamento della valutazione.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra il risultato della valutazione per il modello distribuito in Watson OpenScale. Una volta valutato il modello, è possibile osservare la qualità del modello.

modello valutato




Attività 5: Osservazione della qualità dei monitor del modello

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video che inizia a 04:40.

Il monitor della qualità Watson OpenScale genera una serie di metriche per valutare la qualità del proprio modello. È possibile utilizzare queste metriche di qualità per determinare in che modo il modello prevede i risultati. Quando la valutazione che utilizza i dati di holdout viene completata, attenersi alla seguente procedura per osservare la qualità o l'accuratezza del modello:

  1. Nella sezione Qualità, fare clic sull'icona Configura 'Configura. Qui puoi vedere che la soglia di qualità configurata per questo monitor è del 70% e che la misura della qualità utilizzata è un'area sotto la curva ROC.

  2. Fare clic su Vai al riepilogo del modello per tornare alla finestra dei dettagli del modello.

  3. Nella sezione Qualità, fare clic sull'icona Dettagli 'Dettagli per visualizzare i risultati dettagliati della qualità del modello. Qui è possibile vedere un certo numero di calcoli di metrica di qualità e una matrice di confusione che mostra le decisioni del modello corrette insieme a falsi positivi e falsi negativi. L'area calcolata sotto la curva ROC è 0.9 o superiore, che supera la soglia 0.7 , quindi il modello soddisfa i requisiti di qualità.

  4. Fare clic su Distribuzione modello di approvazione mutuo nella traccia di navigazione per tornare alla schermata dei dettagli del modello.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra i dettagli della qualità in Watson OpenScale. Dopo aver osservato la qualità del modello, è possibile osservare la correttezza del modello.

Qualità




Attività 6: Osservare i monitor del modello per la correttezza

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 05:41.

Il monitor della correttezza Watson OpenScale genera una serie di metriche per valutare la correttezza del tuo modello. È possibile utilizzare le metriche di correttezza per stabilire se il proprio modello produce risultati distorti. Attenersi alla seguente procedura per osservare la correttezza del modello:

  1. Nella sezione Equità, fare clic sull'icona Configura 'Configura. Qui si vede che il modello è in fase di revisione per garantire che i candidati siano trattati in modo equo indipendentemente dal loro sesso. Le donne sono identificate come il gruppo monitorato per il quale viene misurata la correttezza e la soglia per la correttezza deve essere almeno dell ' 80%. Il controllo della correttezza utilizza il metodo di impatto disparato per determinare la correttezza. L'impatto disparato confrontava la percentuale di risultati favorevoli per un gruppo monitorato con la percentuale di risultati favorevoli per un gruppo di riferimento.

  2. Fare clic su Vai al riepilogo del modello per tornare alla finestra dei dettagli del modello.

  3. Nella sezione Equità, fare clic sull'icona Dettagli 'Dettagli per visualizzare i risultati dettagliati dell'equità del modello. Qui viene visualizzata la percentuale di candidati di sesso maschile e femminile che vengono approvati automaticamente, insieme a un punteggio di correttezza superiore al 100%, in modo che le prestazioni del modello superino di gran lunga la soglia di correttezza dell ' 80% richiesta.

  4. Prendere nota dei dataset identificati. Per garantire che le metriche di correttezza siano più accurate, Watson OpenScale utilizza la perturbazione per determinare i risultati in cui vengono modificati solo gli attributi protetti e gli input del modello correlati, mentre le altre funzioni rimangono le stesse. La perturbazione modifica i valori della funzione dal gruppo di riferimento al gruppo monitorato o viceversa. Questi ulteriori guardrail vengono utilizzati per calcolare la correttezza quando viene utilizzato il dataset "bilanciato", ma è anche possibile visualizzare i risultati della correttezza utilizzando solo i dati di addestramento del modello o del payload. Poiché il modello si comporta correttamente, non è necessario entrare in ulteriori dettagli per questa metrica.

    Dataset di correttezza

  5. Fare clic sul percorso di navigazione Distribuzione del modello di approvazione del mutuo per tornare al pannello dei dettagli del modello.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra i dettagli di correttezza in Watson OpenScale. Ora che hai osservato la correttezza del modello, puoi osservare l'esplicabilità del modello.

Equità




Attività 7: Osservare i monitor del modello per la deviazione

video dell'esercitazione di anteprima Per vedere l'anteprima di questo compito, guardate il video a partire da 07:25.

Il monitoraggio della deviazione Watson OpenScale misura le modifiche nei dati nel tempo per assicurare risultati coerenti per il modello. Utilizzare le valutazioni di deviazione per identificare le modifiche nell'output del modello, la precisione delle previsioni e la distribuzione dei dati di input. Attenersi alla seguente procedura per osservare la deviazione del modello:

  1. Nella sezione Deriva, fare clic sull'icona Configura 'Configura. Qui vengono visualizzate le soglie di deviazione. La deviazione dell'output misura la variazione nella distribuzione della confidenza del modello. La deviazione della qualità del modello misura la diminuzione dell'accuratezza confrontando la precisione del tempo di esecuzione stimato con l'accuratezza dell'addestramento. La deviazione della funzione misura la modifica nella distribuzione del valore per funzioni importanti. La configurazione mostra anche il numero di funzioni selezionate e le funzioni più importanti.

  2. Fare clic su Vai al riepilogo del modello per tornare alla finestra dei dettagli del modello.

  3. Nella sezione Deriva, fare clic sull'icona Dettagli 'Dettagli per visualizzare i risultati dettagliati della deriva del modello. È possibile visualizzare la cronologia di come cambia ogni punteggio di metrica nel tempo con un grafico di serie temporali. I valori inferiori sono migliori, quindi, in questo caso, i risultati sono superiori alle soglie superiori impostate nella configurazione. Quindi, visualizzare i dettagli sul modo in cui vengono calcolati l'output dei punteggi e le drift delle funzioni. Puoi anche visualizzare dettagli su ogni funzione per comprendere come contribuiscono ai punteggi generati da Watson OpenScale .

  4. Fare clic sul percorso di navigazione Distribuzione del modello di approvazione del mutuo per tornare al pannello dei dettagli del modello.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra i dettagli della deviazione in Watson OpenScale. Dopo aver osservato la deviazione del modello, è possibile osservare l'esplicabilità del modello.

Deviazione




Attività 8: Osservare i monitoraggi del modello per l'esplicabilità

video dell'esercitazione di anteprima Per vedere l'anteprima di questo compito, guardate il video a partire da 08:46.

È anche importante capire come il modello sia giunto alla decisione. Questa comprensione è necessaria sia per spiegare le decisioni alle persone coinvolte nell'approvazione del mutuo sia per garantire ai proprietari del modello che le decisioni siano valide. Per comprendere queste decisioni, attenersi alla seguente procedura per osservare l'esplicabilità del modello:

  1. Nel pannello di navigazione sinistro, fare clic sull'icona Spiega una transazione 'Spiega una transazione.

  2. Selezionare Distribuzione modello di approvazione mutuo per visualizzare un elenco di transazioni.

  3. Per qualsiasi transazione, fare clic su Spiega nella colonna Azioni . Qui vedete la spiegazione dettagliata di questa decisione. Verranno visualizzati gli input più importanti per il modello e l'importanza di ciascuno per il risultato finale. Le barre blu rappresentano gli input che tendono a supportare la decisione del modello mentre le barre rosse mostrano gli input che potrebbero aver portato a un'altra decisione. Ad esempio, un richiedente potrebbe avere un reddito sufficiente per essere altrimenti approvato, ma la sua storia di credito scadente e il debito elevato insieme portano il modello a rifiutare la domanda. Esaminare questa spiegazione per essere soddisfatti della base della decisione del modello.

  4. (Facoltativo) Se si desidera approfondire il modo in cui il modello ha preso la sua decisione, fare clic sulla scheda Ispeziona . Utilizzare la funzione Ispeziona per analizzare la decisione di trovare aree di sensibilità in cui piccole modifiche a pochi input risulterebbero in una decisione diversa ed è possibile testare la sensibilità sovrascrivendo alcuni degli input effettivi con alternative per vedere se questi avrebbero un impatto sul risultato.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra l'esplicabilità di una transazione in Watson OpenScale. È stato stabilito che il modello è accurato e che tutti i candidati vengono trattati in modo equo. Ora, è possibile avanzare il modello alla fase successiva nel suo ciclo di vita.

Esplicabilità



Passi successivi

Prova queste esercitazioni aggiuntive per ottenere una maggiore esperienza pratica con la valutazione dei modelli:

Ulteriori risorse

  • Visualizza altri video.

  • Panoramica di watsonx

  • Trova dataset di esempio, progetti, modelli, prompt e notebook nell'hub di risorse per ottenere un'esperienza pratica:

    note Blocco appunti che potete aggiungere al vostro progetto per iniziare ad analizzare i dati e costruire i modelli.

    Progetto Progetti che si possono importare contenenti quaderni, set di dati, prompt e altre risorse.

    Dataset Set di dati che si possono aggiungere al progetto per perfezionare, analizzare e costruire modelli.

    Richiesta I prompt che si possono usare nel Prompt Lab per richiedere un foundation model.

    Modello Modelli di fondazione che si possono utilizzare nel Prompt Lab.

Argomento principale: Esercitazioni introduttive

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni