Per rendere operativa l'analisi dei dati e la creazione di modelli, l'azienda ha bisogno di processi e sistemi integrati. Cloud Pak for Data as a Service fornisce i processi e le tecnologie per consentire alla tua azienda di sviluppare e distribuire modelli di machine learning e altre applicazioni di data science.
Guarda questo video per vedere il caso d'uso per implementare una soluzione Data Science and MLOps.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Le sfide
È possibile risolvere le seguenti sfide per la propria azienda implementando un caso di utilizzo Data Science and MLOps:
- Accesso a dati di alta qualità
- Le aziende devono fornire un accesso semplice ai dati gestiti di alta qualità per i team di data science che utilizzano i dati per creare modelli.
- Operazioni di creazione e distribuzione del modello
- Le aziende devono implementare processi ripetibili per sviluppare e distribuire in modo rapido ed efficiente i modelli negli ambienti di produzione.
- Monitoraggio e riaggiornamento dei modelli
- Le aziende devono automatizzare il monitoraggio e il riaggiornamento dei modelli in base al feedback di produzione.
Esempio: le sfide della Golden Bank
Segui la storia di Golden Bank mentre implementa un processo di Data Science e MLOps per espandere la sua attività offrendo rinnovi ipotecari a basso tasso per applicazioni online. I data scientist di Golden Bank devono creare un modello di approvazione del mutuo che eviti il rischio e tratti tutti i richiedenti in modo equo. Devono anche automatizzare il riaddestramento del modello per ottimizzare le prestazioni del modello.
Processo
Per implementare Data Science e MLOps per la tua azienda, la tua azienda può seguire questo processo:
- Preparare e condividere i dati
- Crea e addestra modelli
- Implementazione di modelli
- Monitora modelli distribuiti
- Automatizza il ciclo di vita dell'intelligenza artificiale
I servizi watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog in Cloud Pak for Data as a Service forniscono gli strumenti e i processi necessari alla vostra organizzazione per implementare una soluzione di Data Science e MLOps.
2. Creare e addestrare i modelli
Per ottenere informazioni predittive basate sui tuoi dati, i data scientist, gli analisti di business e gli ingegneri del machine learning possono creare e formare modelli. I data scientist utilizzano i servizi Cloud Pak for Data as a Service per creare i modelli AI, assicurando che vengano utilizzati gli algoritmi e le ottimizzazioni corretti per effettuare previsioni che aiutano a risolvere problemi di business.
Cosa è possibile utilizzare | Cosa puoi fare tu | Migliore da utilizzare quando |
---|---|---|
AutoAI | Utilizzare AutoAI in watsonx.ai Studio per selezionare automaticamente gli algoritmi, ingegnerizzare le caratteristiche, generare candidati di pipeline e addestrare i candidati di pipeline di modelli. ' Quindi, valutare le pipeline classificate e salvare le migliori come modelli. ' Distribuire i modelli addestrati in uno spazio o esportare la pipeline di addestramento del modello che si desidera da AutoAI in un notebook per perfezionarla. |
Si desidera un modo avanzato e automatizzato per creare rapidamente una buona serie di modelli e pipeline di formazione. Si desidera poter esportare le pipeline generate per perfezionarle. |
Notebook e script | Utilizzate i notebook e gli script di watsonx.ai Studio per scrivere il vostro codice di addestramento e valutazione del modello di feature engineering in Python o R. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni a origini dati come database, laghi di dati o archivio oggetti. Codice con le librerie e i framework open source preferiti. |
Vuoi utilizzare le capacità di codifica Python o R per avere il controllo completo del codice utilizzato per creare, addestrare e valutare i modelli. |
Flussi SPSS Modeler | Utilizzate i flussi di SPSS Modeler in watsonx.ai Studio per creare i vostri flussi di formazione, valutazione e punteggio dei modelli. Utilizzare i dataset di addestramento disponibili nel progetto o le connessioni alle origini dati come database, laghi di dati o archiviazione oggetti. | Si desidera un modo semplice per esplorare i dati e definire i flussi di addestramento, valutazione e calcolo del punteggio del modello. |
RStudio | Analizza i dati e crea e verifica i modelli utilizzando R in RStudio. | Si desidera utilizzare un ambiente di sviluppo per lavorare in R. |
Decision Optimization | Preparate i dati, importate i modelli, risolvete i problemi e confrontate gli scenari, visualizzate i dati, trovate le soluzioni, producete report e salvate i modelli da distribuire con watsonx.ai Runtime. | È necessario valutare milioni di possibilità per trovare la soluzione migliore per un problema di analitica prescrittiva. |
Apprendimento federato | Addestrare un modello comune che utilizza dati distribuiti. | È necessario addestrare un modello senza spostare, combinare o condividere i dati distribuiti in più ubicazioni. |
Esempio: creazione di modelli e formazione della Golden Bank
I data scientist di Golden Bank creano un modello, "Mortgage Approval Model" che evita rischi imprevisti e tratta tutti i richiedenti in maniera equa. Desiderano tenere traccia della cronologia e delle prestazioni del modello dall'inizio, in modo da aggiungere un caso di uso del modello al "Catalogo di approvazione del mutuo". Eseguono un notebook per creare il modello e prevedere quali candidati si qualificano per i mutui. I dettagli dell'addestramento del modello vengono automaticamente acquisiti come metadati nel caso di utilizzo del modello.
3. Distribuisci modelli
Quando i membri del team operativo distribuiscono i modelli AI, i modelli diventano disponibili per le applicazioni da utilizzare per il calcolo del punteggio e le previsioni per guidare le azioni.
Cosa è possibile utilizzare | Cosa puoi fare tu | Migliore da utilizzare quando |
---|---|---|
Interfaccia utente spazi | Utilizzare l'interfaccia utente Spazi per distribuire modelli e altri asset dai progetti agli spazi. | Si desidera distribuire modelli e visualizzare informazioni di distribuzione in uno spazio di collaborazione. |
Esempio: distribuzione del modello di Golden Bank
I membri del team operativo di Golden Bank promuovono il "Modello di approvazione del mutuo" dal progetto a uno spazio di distribuzione e quindi creano una distribuzione del modello online.
4. Monitora modelli distribuiti
Dopo che i modelli sono stati distribuiti, è importante monitorarli per assicurarsi che stiano funzionando correttamente. I data scientist devono prestare attenzione alle prestazioni del modello e ai problemi di coerenza dei dati.
Cosa è possibile utilizzare | Cosa puoi fare tu | Migliore da utilizzare quando |
---|---|---|
Watson OpenScale | Problemi di correttezza del modello di monitoraggio in più funzionalità. Consistenza dei dati e prestazioni del modello di monitoraggio nel corso del tempo. Spiegare in che modo il modello è arrivato a determinate previsioni con fattori ponderati. Gestire e creare report sulla governance del modello e sul ciclo di vita nell'organizzazione. |
Si dispone di funzioni protette o che potrebbero contribuire alla correttezza della previsione. Si desidera tenere traccia delle prestazioni del modello e delle congruenza dei dati nel corso del tempo. Si desidera conoscere il motivo per cui il modello fornisce determinate previsioni. |
Esempio: monitoraggio del modello di Golden Bank
I data scientist di Golden Bank utilizzano Watson OpenScale per monitorare il "Modello di approvazione del mutuo" implementato per garantire che sia accurato e che tratti in modo equo tutti i richiedenti del mutuo Golden Bank. Eseguono un notebook per impostare i monitoraggi per il modello e quindi modificano la configurazione utilizzando l'interfaccia utente Watson OpenScale . Utilizzando le metriche del monitoraggio della qualità Watson OpenScale e del monitoraggio della correttezza, i data scientist determinano in che modo il modello prevede i risultati e se produce risultati distorti. Ottengono anche informazioni dettagliate su come il modello arriva alle decisioni in modo che le decisioni possano essere spiegate ai richiedenti del mutuo.
5. Automatizza il ciclo di vita dell'intelligenza artificiale
Il tuo team può automatizzare e semplificare il ciclo di vita di MLOps e AI con Orchestration Pipelines.
Cosa è possibile utilizzare | Cosa puoi fare tu | Migliore da utilizzare quando |
---|---|---|
Pipeline di orchestrazione | Utilizza le pipeline per creare flussi ripetibili e pianificati che automatizzano le pipeline di notebook, Data Refinerye machine learning, dall'inserimento dei dati alla formazione, al test e alla distribuzione dei modelli. | Si desidera automatizzare alcuni o tutti i passi in un flusso MLOps. |
Esempio: ciclo di vita ML automatizzato di Golden Bank
I data scientist di Golden Bank possono utilizzare le pipeline per automatizzare il ciclo di vita completo di Data Science e MLOps e i processi per semplificare il processo di riaggiornamento del modello.
Esercitazioni per Data Science e MLOps
Supporto didattico | Descrizione | Esperienza per l'esercitazione |
---|---|---|
Orchestrate una pipeline AI con il monitoraggio del modello | Formare un modello, promuoverlo in uno spazio di distribuzione e distribuire il modello. | Eseguire un notebook. |
Orchestrate una pipeline AI con l'integrazione dei dati | Crea una pipeline end-to-end che prepara i dati e addestra un modello. | Utilizzare l'interfaccia di trascinamento e rilascio delle pipeline di orchestrazione per creare una pipeline. |
Ulteriori informazioni
Argomento principale: Casi di uso