0 / 0
Torna alla versione inglese della documentazione
Caso di utilizzo di MLOps and trustworthy AI
Caso di utilizzo di MLOps and trustworthy AI

Caso di utilizzo di MLOps and trustworthy AI

Per gestire i dati e gli asset di modello attraverso il ciclo di vita dell'AI, la tua azienda ha bisogno di sistemi e processi integrati. Cloud Pak for Data as a Service fornisce i processi e le tecnologie per consentire alla tua azienda di sviluppare, distribuire, mantenere e gestire i modelli di machine learning (ML) e AI in produzione.

Guarda questo video per vedere il caso di utilizzo del tessuto dati per implementare una soluzione in Cloud Pak for Data.

Questo video fornisce un metodo visivo in alternativa a seguire le fasi scritte in questa documentazione.

Verifiche

Stabilire le soluzioni MLOps and trustworthy AI per le imprese implica affrontare queste sfide:

Accedere ai dati
Organizzazioni devono fornire un facile accesso ai dati consolidati e governati per i team di scienze dei dati che utilizzano i dati per costruire applicazioni affidabili AI e ML.

Operazionalizzare i modelli
Organizzazioni devono implementare processi ripetibili per costruire e distribuire modelli e adottare i modelli in ambienti di produzione.

Garantire la governance del modello e la conformità
Organizzazioni devono monitorare i modelli in produzione per garantire che i modelli siano esplorabili, validi e accurati, e che non introducano bias o drifting lontani dagli obiettivi previsti.

È possibile risolvere queste sfide implementando un ciclo di vita automatizzato MLOps con il tessuto dati su Cloud Pak for Data as a Service.


Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank mentre implementa un processo MLOps and trustworthy AI per espandere la propria attività offrendo rinnovi ipotecari a basso tasso per applicazioni online. Gli scienziati dei dati di Golden Bank hanno bisogno di creare un modello di approvazione dei mutui che eviti il rischio inatteso e tratti in modo equo tutti i richiedenti.

Processo

Per implementare MLOps and trustworthy AI per la tua azienda, la tua organizzazione può seguire questo processo:

  1. Condividi i dati
  2. Modelli di build e treni
  3. Modelli di distribuzione
  4. Modelli di monitoraggio
  5. Modelli di traccia
  6. Automare il ciclo di vita dell'AI

I servizi Watson Studio, Watson Machine Learning, Watson OpenScalee Watson Knowledge Catalog in Cloud Pak for Data as a Service forniscono gli strumenti e i processi di cui la tua organizzazione deve implementare un MLOps and trustworthy AI soluzione.

Immagine che mostra il flusso dei MLOps e del trusworthy AI use case

1. Condividi i dati

Il catalogo funge da archivio di funzioni in cui i tuoi team di data scientist possono trovare asset di dati di alta qualità con le funzioni di cui hanno bisogno. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Cataloghi Utilizza cataloghi in Watson Knowledge Catalog come un feature store per organizzare i tuoi asset da condividere tra i collaboratori nella tua organizzazione.

Prenota ora la ricerca semantica alimentata da AI e consigli per aiutare gli utenti a trovare ciò di cui hanno bisogno.
I tuoi utenti hanno bisogno di comprendere facilmente, collaborare, arricchire e accedere ai dati di alta qualità.

Vuoi aumentare la visibilità dei dati e la collaborazione tra gli utenti aziendali.

Hai bisogno di utenti per visualizzare, accedere, manipolare e analizzare i dati senza capire il proprio formato fisico o la propria posizione, e senza doverlo spostare o copiarlo.

Vuoi che gli utenti potenziino gli asset grazie al rating e rivedendoli.


Esempio: catalogo della Golden Bank

Il leader del team di governance crea un catalogo, "Mutuo Approvazione Catalogo" e aggiunge i dati steward e gli scienziati dei dati come collaboratori di catalogo. Gli steward dati pubblicano gli asset dati che hanno creato nel catalogo. Gli scienziati dei dati trovano gli asset dati, curati dagli steward dei dati, nel catalogo e copiano tali asset in un progetto. Nel loro progetto, gli scienziati dei dati possono perfezionare i dati per prepararlo alla formazione di un modello.


2. Modelli di build e treni

Per ottenere intuizioni predittive in base ai vostri dati, gli scienziati dei dati, gli analisti di business e gli ingegneri di machine learning possono costruire e formare modelli. Gli scienziati dei dati utilizzano i servizi Cloud Pak for Data as a Service per costruire i modelli AI, garantendo che gli algoritmi e le ottimizzazioni giuste siano utilizzati per fare previsioni che aiutano a risolvere i problemi di business.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
AutoAI Utilizzare AutoAI in Watson Studio per selezionare automaticamente gli algoritmi, le funzioni di ingegnere, generare candidati pipeline e i candidati pipeline modello.

Poi, valutare i pipeline classificati e salvare i migliori come modelli.

Deploy i modelli formati ad uno spazio, oppure esportare il pipeline di formazione modello che ti piace da AutoAI in un notebook per perfezionare.
Vuoi un modo avanzato e automatizzato per costruire rapidamente una buona serie di pipeline e modelli di formazione.

Vuoi essere in grado di esportare le pipeline generate per perfezionarle.
Notebook e script Utilizzare notebook e script in Watson Studio per scrivere il proprio modello di formazione del modello di ingegneria della funzione, e il codice di valutazione in Pythono R basato su set di dati di formazione disponibili nel progetto, o connessioni a fonti di dati quali database, laghi dati o storage oggetti.

Utilizzare i tuoi algoritmi e le librerie preferiti.
Si desidera utilizzare le competenze di codifica Python o R per avere il controllo completo del codice utilizzato per creare, formare e valutare i modelli.
Flussi SPSS Modeler Utilizzare i flussi SPSS Modeler in Watson Studio per creare i propri flussi di modelli di formazione, valutazione e scoring basati su set di dati di formazione disponibili nel progetto, o connessioni a fonti di dati quali database, laghi di dati o archiviazione oggetti. Vuoi un modo semplice per esplorare i dati e definire i flussi di formazione, valutazione e scoring dei modelli.
RStudio Analizzare i dati e costruire e testare i modelli lavorando con R in un ambiente di sviluppo RStudio Server con R 3,6. Vuoi usare un ambiente di sviluppo per lavorare in R.
Decision Optimization Preparare i dati, importare modelli, risolvere problemi e confrontare gli scenari, visualizzare i dati, trovare soluzioni, produrre report e salvare i modelli da distribuire con Watson Machine Learning. Devi valutare milioni di possibilità per trovare la soluzione migliore a un problema di analitica prescrittiva.
Apprendimento federato Formare un modello comune utilizzando i dati distribuiti. È necessario formare un modello senza spostare, combinare o condividere dati distribuiti su più posizioni.


Esempio: edificio modello e formazione modello della Golden Bank

Gli scienziati dei dati di Golden Bank creano un modello, "Mutuo Approvazione Model" che evita il rischio inatteso e tratta in modo equo tutti i richiedenti. Vogliono tracciare la storia e le prestazioni del modello fin dall'inizio, quindi aggiungono una voce modello al "Mutuo Approvazione Catalogo". Eseguono un notebook per costruire il modello e prevedere quali richiedenti si qualificano per i mutui. I dettagli della formazione del modello vengono acquisiti automaticamente come metadati nella voce del modello.


3. Modelli di distribuzione

Quando i membri del team di operazioni distribuiscono i tuoi modelli AI, i modelli diventano disponibili per le applicazioni da utilizzare per il punteggio e le previsioni per aiutare le azioni drive.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Interfaccia utente degli spazi (UI) Utilizzare la UI di Spaces in Watson Machine Learning per distribuire modelli e altri asset dai progetti agli spazi. Quando si preferisce utilizzare una UI.
Strumento di linea comandi (cpdctl) Utilizzare lo strumento di riga di comando della cpdctl in Watson Machine Learning per gestire il ciclo di vita dei modelli, comprese le impostazioni di configurazione e per automatizzare un flusso end-to-end che include la formazione del modello, salvandolo, creando uno spazio di distribuzione e distribuendo il modello. Si desidera distribuire e gestire modelli per testare o produrre ambienti da una linea di comando.


Esempio: distribuzione modello della Golden Bank

I membri del team di operazioni alla Golden Bank promuovono il "Mutuo Approvazione Model" dal progetto ad uno spazio di distribuzione e poi crea una distribuzione del modello online.


4. Monitor modelli distribuiti

Dopo che i modelli vengono distribuiti, è importante governarli e monitorarli per assicurarsi che siano esplorabili e trasparenti. Gli scienziati dei dati devono essere in grado di spiegare come i modelli arrivano a determinate previsioni in modo da poter stabilire se le previsioni hanno pregiudizi impliciti o espliciti. Inoltre, è una best practice da guardare per le prestazioni del modello e le problematiche di coerenza dei dati durante il ciclo di vita del modello.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Watson OpenScale Monitorare i problemi di equità del modello su più funzioni.

Monitor modello prestazioni e consistenza dei dati nel tempo.

Explain come il modello è arrivato a determinate previsioni con fattori di peso.

Mantenere e riportare sulla governance del modello e il ciclo di vita attraverso la tua organizzazione.
Quando si hanno caratteristiche che sono protette o che potrebbero contribuire all'equità di previsione.

È necessario tracciare le prestazioni del modello e le consistenze dei dati nel tempo.

È necessario sapere perché il modello dà determinate previsioni.


Esempio: monitoraggio modello della Golden Bank

Gli scienziati dei dati di Golden Bank utilizzano Watson OpenScale per monitorare lo schieramento "Mutuo Approvazione Model" per assicurarsi che sia accurato e trattando in modo equo tutti i richiedenti ipotecari della Golden Bank. Eseguono un notebook per impostare monitor per il modello e poi tweak la configurazione utilizzando l'interfaccia utente Watson OpenScale . Utilizzando le metriche dal monitor di qualità e dal monitor di qualità di Watson OpenScale , gli scienziati dei dati determinano quanto bene il modello prevede esiti e se produce esiti biased. Guadagnano anche una comprensione di come il modello arriva alle decisioni in modo che le decisioni possano essere spiegate ai richiedenti ipotecari.


5. Modelli di terra

Oltre a monitorare i tuoi modelli per l'equità e l'esplorabilità, il tuo team ha bisogno di tracciare i modelli di produzione per garantire che si esibiranno bene.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Fogli di factfogli Nell'inventario del modello in un catalogo in Watson Knowledge Catalog, visualizzare lo stato del ciclo di vita per tutte le attività registrate e trapelare su factsheet dettagliati per modelli o distribuzioni registrati alla voce del modello.

Visualizza dettagli modello generale, informazioni formative e metriche di input e output.

Visualizza dettagli generali di distribuzione, dettagli di valutazione, metriche di qualità, dettagli di equità e dettagli di deriva.
Si desidera assicurarsi che il proprio modello si esibirà come previsto.

Si desidera stabilire se è necessario effettuare delle regolazioni.


Esempio: tracciamento modello della Golden Bank

Gli analisti di business a Golden Bank richiedono un "Mutuo Approvazione Model". Possono quindi tracciare il modello attraverso tutte le fasi del ciclo di vita dell'AI come gli scienziati di dati costruiscono e addestrano gli ingegneri modello e ModelOps distribuiscono e valutano. Factsheet documenta i dettagli sulla cronologia del modello e generano metriche che mostrano le sue prestazioni.


6. Automare il ciclo di vita ML

Il tuo team può automatizzare e semplificare il ciclo di vita MLOps e AI con pipeline Watson Studio (Beta).

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Condutture (Beta) Utilizzare le pipeline in Watson Studio per creare flussi ripetibili e pianificati che automatizzano notebook, Data Refinerye pipeline di machine learning, dall'ingestione dei dati alla formazione di modelli, alla verifica e alla distribuzione. Si desidera automatizzare qualsiasi o tutti i passi del flusso MLOps.


Esempio: il ciclo di vita di ML automatizzato di Golden Bank

Gli scienziati dei dati di Golden Bank possono anche utilizzare le pipeline per automatizzare il loro ciclo di vita completo MLOps and trustworthy AI e i processi per semplificare il processo di approvazione dei mutui.


Esercitazioni per MLOps and trustworthy AI

Supporto didattico Descrizione Competenze per il tutorial
Crea e distribuiamo un modello Formare un modello, promuoverlo in uno spazio di distribuzione e distribuire il modello. Eseguire un notebook.
Test e convalida del modello Valutare un modello per la precisione, l'equità e l'esplorazione. Eseguire un notebook e visualizzare i risultati nell'interfaccia utente.

Ulteriori informazioni

Argomento principale: Panoramica della soluzione del fabric dei dati