Panoramica della soluzione Data Fabric
Quando si implementa la soluzione di data fabric su Cloud Pak for Data, è possibile risolvere le problematiche di accesso ai dati, qualità dei dati, governance dei dati e gestione dei propri cicli di vita di dati e AI.
La soluzione data fabric su Cloud Pak for Data fornisce queste funzionalità principali per la gestione e l'automazione dei cicli di vita AI e dei dati:
- Accesso ai dati
- Accedi ai tuoi dati su più cloud e in loco nella tua architettura di dati esistente.
- Consumo self-service
- Condividere e utilizzare i dati e altri asset dell'azienda nei cataloghi.
- Conoscenza accumulata
- Comprendere i propri dati tramite un vocabolario di business comune. Considera affidabili i tuoi dati attraverso la cronologia, la derivazione e l'analisi della qualità.
- Innovazione collaborativa
- Collabora con gli altri per scoprire informazioni dettagliate. Prepara i dati, analizza i dati e crea modelli con una serie di tool integrati per tutti i livelli di esperienza.
- Governance e conformità
- Definire le regole per applicare la privacy dei dati. Tenere traccia e documentare la cronologia dettagliata dei modelli AI per garantire la conformità.
- Ciclo di vita unificato
- Automatizza la creazione, il test, l'implementazione e il monitoraggio di pipeline di dati e modelli AI.
Il valore degli asset
Con il data fabric, è possibile trasformare i dati in asset che accumulano significato e valore. Gli asset sono più di semplici dati. Quando si crea una prima connessione a una origine dati, si dispone di informazioni di base su come accedere ai dati, alle tabelle, agli schemi e ai valori dei dati. Si inizia ad aggiungere valore durante l'inserimento dei dati virtualizzando, trasformando o replicando i dati negli spazi di lavoro denominati progetti.
Quando si curano i dati, si aggiungono metadati agli asset di dati. Creare il profilo dei dati per classificarli e compilare le statistiche relative ai valori. Arricchire gli asset con un vocabolario di business che descrive il significato semantico dei dati per la propria azienda. Si analizza la qualità dei dati. I metadati che aggiungi durante la cura sono considerati metadati attivi, perché vengono generati automaticamente tramite processi di machine learning. Quando si riesegue la curation dopo le modifiche dei dati, i metadati vengono aggiornati in base all'analisi dei dati automatizzata.
Quando gli utenti utilizzano gli asset nei progetti, creano il terzo livello di significato che descrive la cronologia di utilizzo dell'asset e le relazioni tra gli asset. Gli utenti possono analizzare i dati nei notebook o nei dashboard o addestrare i modelli di machine learning.
Gli utenti possono anche aggiungere informazioni agli asset, come valutazioni e revisioni, visualizzazioni dei dati, tag e altre relazioni.
La seguente immagine mostra in che modo gli asset di dati accumulano un valore in un fabric di dati.
Anche i modelli sono asset. È possibile tenere traccia delle distribuzioni e dei dati di input per il modello, dei confronti tra i modelli, della conformità con protocolli aziendali e di altre metriche delle prestazioni.
Casi d'uso
Cloud Pak for Data as a Service fornisce quattro casi di utilizzo come parte della soluzione data fabric. Implementa il data fabric come rappresentato in ogni caso di utilizzo creando una o più istanze del servizio che forniscono funzioni e strumenti. Alcuni servizi sono inclusi in più casi di utilizzo.
I casi di utilizzo rappresentano modi per implementare parte della soluzione data fabric in modo che i team possano iniziare a lavorare mentre si creano altre parti. Puoi iniziare con qualsiasi caso d'uso e aggiungere gli altri quando ne hai bisogno:
- Se hai un modello di governance dei dati più maturo, inizia stabilendo il tuo vocabolario di business, come descritto nel caso d'uso di governance dei dati.
- Se si desidera un time - to - value più rapido, iniziare con la virtualizzazione dei dati o la scienza dei dati, come descritto nei casi di integrazione dei dati e nei casi di utilizzo di Data Science e MLOps.
- Se hai bisogno di assicurarti che i tuoi modelli siano conformi agli obiettivi e ai regolamenti della tua organizzazione, inizia a tenere traccia dei tuoi modelli, come descritto nel caso d'uso di governance AI.
Esplora ogni caso d'uso per scoprire cosa puoi realizzare e gli strumenti che puoi usare.
Governance dei dati
Implementare la governance basata su metadati che forniscono conoscenze di business e definiscono la protezione dei dati. Fornire asset di dati di alta qualità in cataloghi self-service. Automatizza l'applicazione della governance dei dati per la conformità normativa.
Servizi per questo caso d'uso: Watson Knowledge Catalog e IBM Match 360 with Watson.
Integrazione dati
Semplifica e automatizza l'accesso a tutti i dati, senza spostarli. Organizza i dati in un ambiente distribuito per creare una rete di informazioni immediatamente disponibili per i consumatori di dati.
Servizi per questo caso d'uso: Watson Query, DataStagee Watson Knowledge Catalog.
Vedere caso d'uso di integrazione dati.
Data Science e MLOps
Rendere operativa l'analisi dei dati e la creazione dei modelli con un flusso di lavoro automatizzato che prepara i dati, crea, distribuisce, monitora e ricrea i modelli.
Servizi per questo caso d'uso: Watson Studio, Watson Machine Learning, Watson OpenScalee Watson Knowledge Catalog.
Governance AI
Rendere operativa la governance AI con un flusso di lavoro automatico che applica correttezza, qualità e spiegabilità nei modelli.
Servizi per questo caso d'uso: Watson Studio, Watson Machine Learning, Watson OpenScalee Watson Knowledge Catalog.
Vedere AI governance use case.