0 / 0
Torna alla versione inglese della documentazione
Caso d'uso Data Science e MLOps
Caso d'uso Data Science e MLOps

Caso d'uso Data Science e MLOps

Per rendere operativa l'analisi dei dati e la creazione di modelli, l'azienda ha bisogno di processi e sistemi integrati. Cloud Pak for Data as a Service fornisce i processi e le tecnologie per consentire alla tua azienda di sviluppare e distribuire modelli di machine learning e altre applicazioni di data science.

Guarda questo video per vedere il caso di utilizzo di data fabric per l'implementazione di una soluzione Data Science and MLOps in Cloud Pak for Data.

Questo video fornisce un metodo visivo come alternativa alla procedura scritta in questa documentazione.

Verifiche

Stabilire soluzioni di Data Science e MLOps per le imprese significa affrontare queste sfide:

Accesso ai dati di alta qualità
Le aziende devono fornire un accesso semplice ai dati governati di alta qualità per i team di data science che utilizzano i dati per creare modelli.

Operationalizing model building and deployment
Le aziende devono implementare processi ripetibili per creare e distribuire modelli in modo rapido ed efficiente in ambienti di produzione.

Monitoraggio e riaggiornamento dei modelli
Le organizzazioni devono automatizzare il monitoraggio e il riaggiornamento dei modelli in base ai feedback di produzione.

Puoi risolvere queste sfide implementando un data fabric su Cloud Pak for Data as a Service.


Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank mentre implementa un processo di Data Science e MLOps per espandere la sua attività offrendo rinnovi ipotecari a basso tasso per applicazioni online. I data scientist di Golden Bank devono creare un modello di approvazione del mutuo che eviti il rischio e tratti tutti i richiedenti in modo equo. Devono anche automatizzare il riaddestramento del modello per ottimizzare le prestazioni del modello.

Processo

Per implementare Data Science e MLOps per la tua azienda, la tua azienda può seguire questo processo:

  1. Preparare e condividere i dati
  2. Crea e addestra modelli
  3. Distribuisci modelli
  4. Modelli di monitoraggio
  5. Automatizza il ciclo di vita dell'intelligenza artificiale

I servizi Watson Studio, Watson Machine Learning, Watson OpenScalee Watson Knowledge Catalog in Cloud Pak for Data as a Service forniscono gli strumenti e i processi necessari alla tua organizzazione per implementare una soluzione Data Science and MLOps.

Immagine che mostra il flusso del caso d'uso di data science

1. Preparare e condividere i dati

I data scientist possono preparare i propri dataset e condividerli in un catalogo. Il catalogo funge da negozio di funzioni in cui i team di data scientist possono trovare risorse di dati di alta qualità con le funzioni di cui hanno bisogno. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Data Refinery Accedere e perfezionare i dati da diverse connessioni di origini dati.

Materializzare i dataset risultanti come istantanee nel tempo che potrebbero combinare, unire o filtrare i dati per consentire ad altri data scientist di analizzare ed esplorare.

Rendere i dataset risultanti disponibili nei cataloghi.
È necessario visualizzare i dati quando si desidera modellarli o ripulirli.

Si desidera semplificare il processo di preparazione di grandi quantità di dati non elaborati per l'analisi.
Cataloghi Utilizzare i cataloghi in Watson Knowledge Catalog come negozio di funzioni per organizzare le proprie risorse da condividere tra i collaboratori nella propria organizzazione.

Approfittare della ricerca semantica basata sull'intelligenza artificiale e dei suggerimenti per aiutare gli utenti a trovare ciò di cui hanno bisogno.
Gli utenti devono facilmente comprendere, collaborare, arricchire e accedere ai dati di alta qualità.

Si desidera aumentare la visibilità dei dati e la collaborazione tra gli utenti di business.

Gli utenti devono visualizzare, accedere, manipolare e analizzare i dati senza comprenderne il formato fisico o l'ubicazione e senza doverli spostare o copiare.

Si desidera che gli utenti migliorino gli asset valutandoli e riesaminandoli.


Esempio: catalogo di Golden Bank

Il responsabile del team di governance crea un catalogo, "Mortgage Approval Catalog" e aggiunge gli steward di dati e i data scientist come collaboratori del catalogo. Gli steward di dati pubblicano gli asset di dati creati nel catalogo. I data scientist trovano gli asset di dati, curati dagli steward di dati, nel catalogo e li copiano in un progetto. Nel loro progetto, i data scientist possono perfezionare i dati per prepararli all'addestramento di un modello.


2. Creare e addestrare i modelli

Per ottenere informazioni predittive basate sui tuoi dati, i data scientist, gli analisti di business e gli ingegneri del machine learning possono creare e formare modelli. I data scientist utilizzano i servizi Cloud Pak for Data as a Service per creare i modelli AI, assicurando che vengano utilizzati gli algoritmi e le ottimizzazioni corretti per effettuare previsioni che aiutano a risolvere problemi di business.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
AutoAI Utilizza AutoAI in Watson Studio per selezionare automaticamente gli algoritmi, le funzioni di progettazione, generare i candidati della pipeline e formare i candidati della pipeline del modello.

Quindi, valuta le pipeline classificate e salva le migliori come modelli.

Distribuisci i modelli addestrati in uno spazio oppure esporta la pipeline di formazione del modello che ti piace da AutoAI in un notebook per perfezionarla.
Si desidera un modo avanzato e automatizzato per creare rapidamente una buona serie di modelli e pipeline di formazione.

Si desidera poter esportare le pipeline generate per perfezionarle.
Notebook e script Utilizzare i notebook e gli script in Watson Studio per scrivere il proprio codice di valutazione e di formazione del modello di progettazione della funzionalità in Python o R. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni a origini dati come database, laghi di dati o archivio oggetti.

Codice con le librerie e i framework open source preferiti.
Vuoi utilizzare le capacità di codifica Python o R per avere il controllo completo del codice utilizzato per creare, addestrare e valutare i modelli.
Flussi SPSS Modeler Utilizzare i flussi SPSS Modeler in Watson Studio per creare i propri flussi di formazione, valutazione e calcolo del punteggio del modello. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni alle origini dati come database, laghi di dati o archiviazione oggetti. Si desidera un modo semplice per esplorare i dati e definire i flussi di addestramento, valutazione e calcolo del punteggio del modello.
RStudio Analizza i dati e crea e verifica i modelli utilizzando R in RStudio. Si desidera utilizzare un ambiente di sviluppo per lavorare in R.
Decision Optimization Prepara dati, importa modelli, risolvi problemi e confronta scenari, visualizza dati, trova soluzioni, produci report e salva modelli da distribuire con Watson Machine Learning. È necessario valutare milioni di possibilità per trovare la soluzione migliore per un problema di analitica prescrittiva.
Apprendimento federato Addestrare un modello comune che utilizza dati distribuiti. È necessario addestrare un modello senza spostare, combinare o condividere i dati distribuiti in più ubicazioni.


Esempio: creazione di modelli e formazione della Golden Bank

I data scientist di Golden Bank creano un modello, "Mortgage Approval Model" che evita rischi imprevisti e tratta tutti i richiedenti in maniera equa. Desiderano tenere traccia della cronologia e delle prestazioni del modello dall'inizio, in modo da aggiungere un caso di uso del modello al "Catalogo di approvazione del mutuo". Eseguono un notebook per creare il modello e prevedere quali candidati si qualificano per i mutui. I dettagli dell'addestramento del modello vengono automaticamente acquisiti come metadati nel caso di utilizzo del modello.


3. Distribuisci modelli

Quando i membri del team operativo distribuiscono i modelli AI, i modelli diventano disponibili per le applicazioni da utilizzare per il calcolo del punteggio e le previsioni per guidare le azioni.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Interfaccia utente spazi Utilizza la IU Spaces in Watson Machine Learning per distribuire modelli e altri asset da progetti a spazi. Si desidera distribuire modelli e visualizzare informazioni di distribuzione in uno spazio di collaborazione.


Esempio: distribuzione del modello di Golden Bank

I membri del team operativo di Golden Bank promuovono il "Modello di approvazione del mutuo" dal progetto a uno spazio di distribuzione e quindi creano una distribuzione del modello online.


4. Monitora modelli distribuiti

Dopo che i modelli sono stati distribuiti, è importante monitorarli per assicurarsi che stiano funzionando correttamente. I data scientist devono prestare attenzione alle prestazioni del modello e ai problemi di coerenza dei dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Watson OpenScale Problemi di correttezza del modello di monitoraggio in più funzionalità.

Consistenza dei dati e prestazioni del modello di monitoraggio nel corso del tempo.

Spiegare in che modo il modello è arrivato a determinate previsioni con fattori ponderati.

Gestire e creare report sulla governance del modello e sul ciclo di vita nell'organizzazione.
Si dispone di funzioni protette o che potrebbero contribuire alla correttezza della previsione.

Si desidera tenere traccia delle prestazioni del modello e delle congruenza dei dati nel corso del tempo.

Si desidera conoscere il motivo per cui il modello fornisce determinate previsioni.


Esempio: monitoraggio del modello di Golden Bank

I data scientist di Golden Bank utilizzano Watson OpenScale per monitorare il "Modello di approvazione del mutuo" implementato per garantire che sia accurato e che tratti in modo equo tutti i richiedenti del mutuo Golden Bank. Eseguono un notebook per impostare i monitoraggi per il modello e quindi modificano la configurazione utilizzando l'interfaccia utente Watson OpenScale . Utilizzando le metriche del monitoraggio della qualità Watson OpenScale e del monitoraggio della correttezza, i data scientist determinano in che modo il modello prevede i risultati e se produce risultati distorti. Ottengono anche informazioni dettagliate su come il modello arriva alle decisioni in modo che le decisioni possano essere spiegate ai richiedenti del mutuo.


5. Automatizza il ciclo di vita ML

Il tuo team può automatizzare e semplificare il ciclo di vita di MLOps e AI con le pipeline Watson .

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Watson Pipeline Utilizza le pipeline per creare flussi ripetibili e pianificati che automatizzano le pipeline di notebook, Data Refinerye machine learning, dall'inserimento dei dati alla formazione, al test e alla distribuzione dei modelli. Si desidera automatizzare alcuni o tutti i passi in un flusso MLOps.


Esempio: ciclo di vita ML automatizzato di Golden Bank

I data scientist di Golden Bank possono utilizzare le pipeline per automatizzare il ciclo di vita completo di Data Science e MLOps e i processi per semplificare il processo di riaggiornamento del modello.


Esercitazioni per Data Science e MLOps

Supporto didattico Descrizione Esperienza per l'esercitazione
Orchestrate una pipeline AI con il monitoraggio del modello Formare un modello, promuoverlo in uno spazio di distribuzione e distribuire il modello. Eseguire un notebook.
Orchestrate e AI pipeline con integrazione dati Crea una pipeline end-to-end che prepara i dati e addestra un modello. Utilizza l'interfaccia di trascinamento e rilascio delle pipeline Watson per creare una pipeline.

Ulteriori informazioni

Argomento principale: Panoramica della soluzione Data fabric