0 / 0
Torna alla versione inglese della documentazione
Caso d'uso Data Science e MLOps
Ultimo aggiornamento: 21 nov 2024
Caso d'uso Data Science e MLOps

Per rendere operativa l'analisi dei dati e la creazione di modelli, l'azienda ha bisogno di processi e sistemi integrati. Cloud Pak for Data as a Service fornisce i processi e le tecnologie per consentire alla tua azienda di sviluppare e distribuire modelli di machine learning e altre applicazioni di data science.

Guarda questo video per vedere il caso d'uso per implementare una soluzione Data Science and MLOps.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.

Le sfide

È possibile risolvere le seguenti sfide per la propria azienda implementando un caso di utilizzo Data Science and MLOps:

Accesso a dati di alta qualità
Le aziende devono fornire un accesso semplice ai dati gestiti di alta qualità per i team di data science che utilizzano i dati per creare modelli.
Operazioni di creazione e distribuzione del modello
Le aziende devono implementare processi ripetibili per sviluppare e distribuire in modo rapido ed efficiente i modelli negli ambienti di produzione.
Monitoraggio e riaggiornamento dei modelli
Le aziende devono automatizzare il monitoraggio e il riaggiornamento dei modelli in base al feedback di produzione.

Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank mentre implementa un processo di Data Science e MLOps per espandere la sua attività offrendo rinnovi ipotecari a basso tasso per applicazioni online. I data scientist di Golden Bank devono creare un modello di approvazione del mutuo che eviti il rischio e tratti tutti i richiedenti in modo equo. Devono anche automatizzare il riaddestramento del modello per ottimizzare le prestazioni del modello.

Processo

Per implementare Data Science e MLOps per la tua azienda, la tua azienda può seguire questo processo:

  1. Preparare e condividere i dati
  2. Crea e addestra modelli
  3. Implementazione di modelli
  4. Monitora modelli distribuiti
  5. Automatizza il ciclo di vita dell'intelligenza artificiale

I servizi watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog in Cloud Pak for Data as a Service forniscono gli strumenti e i processi necessari alla vostra organizzazione per implementare una soluzione di Data Science e MLOps.

Immagine che mostra il flusso del caso d'uso di data science

1. Preparare e condividere i dati

I data scientist possono preparare i propri dataset e condividerli in un catalogo. Il catalogo funge da negozio di funzioni in cui i team di data scientist possono trovare risorse di dati di alta qualità con le funzioni di cui hanno bisogno. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Data Refinery Accedere e perfezionare i dati da diverse connessioni di origini dati.

Materializzare i dataset risultanti come istantanee nel tempo che potrebbero combinare, unire o filtrare i dati per consentire ad altri data scientist di analizzare ed esplorare.

Rendere i dataset risultanti disponibili nei cataloghi.
È necessario visualizzare i dati quando si desidera modellarli o ripulirli.

Si desidera semplificare il processo di preparazione di grandi quantità di dati non elaborati per l'analisi.
Cataloghi Utilizzate i cataloghi in 'IBM Knowledge Catalog come archivio di funzionalità per organizzare le risorse da condividere tra i collaboratori della vostra organizzazione.
'
Sfruttate la ricerca semantica alimentata dall'intelligenza artificiale e le raccomandazioni per aiutare gli utenti a trovare ciò di cui hanno bisogno.
Gli utenti devono facilmente comprendere, collaborare, arricchire e accedere ai dati di alta qualità.

Si desidera aumentare la visibilità dei dati e la collaborazione tra gli utenti di business.

Gli utenti devono visualizzare, accedere, manipolare e analizzare i dati senza comprenderne il formato fisico o l'ubicazione e senza doverli spostare o copiare.

Si desidera che gli utenti migliorino gli asset valutandoli e riesaminandoli.

Esempio: catalogo di Golden Bank

Il responsabile del team di governance crea un catalogo, "Mortgage Approval Catalog" e aggiunge gli steward di dati e i data scientist come collaboratori del catalogo. Gli steward di dati pubblicano gli asset di dati creati nel catalogo. I data scientist trovano gli asset di dati, curati dagli steward di dati, nel catalogo e li copiano in un progetto. Nel loro progetto, i data scientist possono perfezionare i dati per prepararli all'addestramento di un modello.


2. Creare e addestrare i modelli

Per ottenere informazioni predittive basate sui tuoi dati, i data scientist, gli analisti di business e gli ingegneri del machine learning possono creare e formare modelli. I data scientist utilizzano i servizi Cloud Pak for Data as a Service per creare i modelli AI, assicurando che vengano utilizzati gli algoritmi e le ottimizzazioni corretti per effettuare previsioni che aiutano a risolvere problemi di business.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
AutoAI Utilizzare AutoAI in watsonx.ai Studio per selezionare automaticamente gli algoritmi, ingegnerizzare le caratteristiche, generare candidati di pipeline e addestrare i candidati di pipeline di modelli.
'
Quindi, valutare le pipeline classificate e salvare le migliori come modelli.
'
Distribuire i modelli addestrati in uno spazio o esportare la pipeline di addestramento del modello che si desidera da AutoAI in un notebook per perfezionarla.
Si desidera un modo avanzato e automatizzato per creare rapidamente una buona serie di modelli e pipeline di formazione.

Si desidera poter esportare le pipeline generate per perfezionarle.
Notebook e script Utilizzate i notebook e gli script di watsonx.ai Studio per scrivere il vostro codice di addestramento e valutazione del modello di feature engineering in Python o R. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni a origini dati come database, laghi di dati o archivio oggetti.

Codice con le librerie e i framework open source preferiti.
Vuoi utilizzare le capacità di codifica Python o R per avere il controllo completo del codice utilizzato per creare, addestrare e valutare i modelli.
Flussi SPSS Modeler Utilizzate i flussi di SPSS Modeler in watsonx.ai Studio per creare i vostri flussi di formazione, valutazione e punteggio dei modelli. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni alle origini dati come database, laghi di dati o archiviazione oggetti. Si desidera un modo semplice per esplorare i dati e definire i flussi di addestramento, valutazione e calcolo del punteggio del modello.
RStudio Analizza i dati e crea e verifica i modelli utilizzando R in RStudio. Si desidera utilizzare un ambiente di sviluppo per lavorare in R.
Decision Optimization Preparate i dati, importate i modelli, risolvete i problemi e confrontate gli scenari, visualizzate i dati, trovate le soluzioni, producete report e salvate i modelli da distribuire con watsonx.ai Runtime. È necessario valutare milioni di possibilità per trovare la soluzione migliore per un problema di analitica prescrittiva.
Apprendimento federato Addestrare un modello comune che utilizza dati distribuiti. È necessario addestrare un modello senza spostare, combinare o condividere i dati distribuiti in più ubicazioni.

Esempio: creazione di modelli e formazione della Golden Bank

I data scientist di Golden Bank creano un modello, "Mortgage Approval Model" che evita rischi imprevisti e tratta tutti i richiedenti in maniera equa. Desiderano tenere traccia della cronologia e delle prestazioni del modello dall'inizio, in modo da aggiungere un caso di uso del modello al "Catalogo di approvazione del mutuo". Eseguono un notebook per creare il modello e prevedere quali candidati si qualificano per i mutui. I dettagli dell'addestramento del modello vengono automaticamente acquisiti come metadati nel caso di utilizzo del modello.


3. Distribuisci modelli

Quando i membri del team operativo distribuiscono i modelli AI, i modelli diventano disponibili per le applicazioni da utilizzare per il calcolo del punteggio e le previsioni per guidare le azioni.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Interfaccia utente spazi Utilizzare l'interfaccia utente Spazi per distribuire modelli e altri asset dai progetti agli spazi. Si desidera distribuire modelli e visualizzare informazioni di distribuzione in uno spazio di collaborazione.


Esempio: distribuzione del modello di Golden Bank

I membri del team operativo di Golden Bank promuovono il "Modello di approvazione del mutuo" dal progetto a uno spazio di distribuzione e quindi creano una distribuzione del modello online.


4. Monitora modelli distribuiti

Dopo che i modelli sono stati distribuiti, è importante monitorarli per assicurarsi che stiano funzionando correttamente. I data scientist devono prestare attenzione alle prestazioni del modello e ai problemi di coerenza dei dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Watson OpenScale Problemi di correttezza del modello di monitoraggio in più funzionalità.

Consistenza dei dati e prestazioni del modello di monitoraggio nel corso del tempo.

Spiegare in che modo il modello è arrivato a determinate previsioni con fattori ponderati.

Gestire e creare report sulla governance del modello e sul ciclo di vita nell'organizzazione.
Si dispone di funzioni protette o che potrebbero contribuire alla correttezza della previsione.

Si desidera tenere traccia delle prestazioni del modello e delle congruenza dei dati nel corso del tempo.

Si desidera conoscere il motivo per cui il modello fornisce determinate previsioni.

Esempio: monitoraggio del modello di Golden Bank

I data scientist di Golden Bank utilizzano Watson OpenScale per monitorare il "Modello di approvazione del mutuo" implementato per garantire che sia accurato e che tratti in modo equo tutti i richiedenti del mutuo Golden Bank. Eseguono un notebook per impostare i monitoraggi per il modello e quindi modificano la configurazione utilizzando l'interfaccia utente Watson OpenScale . Utilizzando le metriche del monitoraggio della qualità Watson OpenScale e del monitoraggio della correttezza, i data scientist determinano in che modo il modello prevede i risultati e se produce risultati distorti. Ottengono anche informazioni dettagliate su come il modello arriva alle decisioni in modo che le decisioni possano essere spiegate ai richiedenti del mutuo.


5. Automatizza il ciclo di vita dell'intelligenza artificiale

Il tuo team può automatizzare e semplificare il ciclo di vita di MLOps e AI con Orchestration Pipelines.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Pipeline di orchestrazione Utilizza le pipeline per creare flussi ripetibili e pianificati che automatizzano le pipeline di notebook, Data Refinerye machine learning, dall'inserimento dei dati alla formazione, al test e alla distribuzione dei modelli. Si desidera automatizzare alcuni o tutti i passi in un flusso MLOps.

Esempio: ciclo di vita ML automatizzato di Golden Bank

I data scientist di Golden Bank possono utilizzare le pipeline per automatizzare il ciclo di vita completo di Data Science e MLOps e i processi per semplificare il processo di riaggiornamento del modello.


Esercitazioni per Data Science e MLOps

Supporto didattico Descrizione Esperienza per l'esercitazione
Orchestrate una pipeline AI con il monitoraggio del modello Formare un modello, promuoverlo in uno spazio di distribuzione e distribuire il modello. Eseguire un notebook.
Orchestrate una pipeline AI con l'integrazione dei dati Crea una pipeline end-to-end che prepara i dati e addestra un modello. Utilizzare l'interfaccia di trascinamento e rilascio delle pipeline di orchestrazione per creare una pipeline.

Ulteriori informazioni

Argomento principale: Casi di uso

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni