Puoi utilizzare Cloud Pak for Data con diversi servizi per implementare i casi di utilizzo che ti aiutano a creare una base di dati attendibile per le tue operazioni di intelligenza artificiale.
Panoramica della soluzione Data Fabric
Quando si implementa la soluzione di data fabric su Cloud Pak for Data, è possibile risolvere le sfide di accesso ai dati, qualità dei dati, governance dei dati e gestione dei cicli di vita dei dati.
La soluzione data fabric su Cloud Pak for Data fornisce queste funzionalità principali per la gestione e l'automazione dei cicli di vita dei dati:
- Accesso ai dati
- Accedi ai tuoi dati su più cloud e in loco nella tua architettura di dati esistente.
- Consumo self-service
- Condividere e utilizzare i dati e altri asset dell'azienda nei cataloghi.
- Conoscenza accumulata
- Comprendere i propri dati tramite un vocabolario di business comune. Considera affidabili i tuoi dati attraverso la cronologia, la derivazione e l'analisi della qualità.
- Innovazione collaborativa
- Collabora con gli altri per scoprire informazioni dettagliate. Prepara e analizza i dati con una serie di strumenti integrati per tutti i livelli.
- Governance e conformità
- Definire le regole per applicare la privacy dei dati.
- Ciclo di vita unificato
- Automatizza la creazione, il test, la distribuzione e il monitoraggio delle pipeline di dati.
La seguente illustrazione mostra in che modo il data fabric supporta i casi di utilizzo sulla piattaforma Cloud Pak for Data (sia cloud che on premise) integrando l'accesso alle origini dati ibride (ad esempio, data lakehouse, data warehouse, data lake, database o applicazione di business) con funzionalità in una singola esperienza dell'interfaccia utente.
Il valore degli asset
Con il data fabric, è possibile trasformare i dati in asset che accumulano significato e valore. Gli asset sono più di semplici dati. Quando si crea una prima connessione a una origine dati, si dispone di informazioni di base su come accedere ai dati, alle tabelle, agli schemi e ai valori dei dati. Si inizia ad aggiungere valore durante l'inserimento dei dati virtualizzando, trasformando o replicando i dati negli spazi di lavoro denominati progetti.
Quando si curano i dati, si aggiungono metadati agli asset di dati. Creare il profilo dei dati per classificarli e compilare le statistiche relative ai valori. Arricchire gli asset con un vocabolario di business che descrive il significato semantico dei dati per la propria azienda. Si analizza la qualità dei dati. I metadati che aggiungi durante la cura vengono considerati metadati attivi perché vengono generati automaticamente tramite processi di machine learning. Quando si riesegue la curation dopo le modifiche dei dati, i metadati vengono aggiornati in base all'analisi dei dati automatizzata.
Quando gli utenti utilizzano gli asset nei progetti, creano il terzo livello di significato che descrive la cronologia di utilizzo dell'asset e le relazioni tra gli asset. Gli utenti possono analizzare i dati nei notebook o nei dashboard o addestrare i modelli di machine learning.
Gli utenti possono anche aggiungere informazioni agli asset, come valutazioni e revisioni, visualizzazioni dei dati, tag e altre relazioni.
La seguente immagine mostra in che modo gli asset di dati accumulano valore in un fabric di dati aggiungendo informazioni descrittive (profilo dati, qualità dei dati e vocabolario aziendale), informazioni sull'utilizzo (azioni sui dati e sulle relazioni) e informazioni aggiunte dall'utente (valutazioni e revisioni, visualizzazioni e relazioni) alle informazioni di base (tipo di dati, formato e schema e dove risiedono i dati) sull'asset di dati.
Casi di utilizzo di Data Fabric
Cloud Pak for Data fornisce diversi casi di utilizzo come parte della soluzione data fabric. Si implementa il data fabric come rappresentato in ogni caso di utilizzo installando uno o più servizi che forniscono funzioni e strumenti. Alcuni servizi sono inclusi in più casi di utilizzo.
I casi di utilizzo rappresentano modi per implementare parte della soluzione data fabric in modo che il team possa iniziare a lavorare mentre si creano altre parti. Puoi iniziare con qualsiasi caso d'uso e aggiungere gli altri quando ne hai bisogno:
- Se hai un modello di governance dei dati più maturo, inizia stabilendo il tuo vocabolario di business, come descritto nel caso d'uso di governance dei dati.
- Se si desidera un time - to - value più rapido, iniziare con la virtualizzazione dei dati o la replica dei dati, come descritto nel caso di utilizzo dell'integrazione dei dati.
- Se devi assicurarti che i tuoi utenti e sistemi abbiano una vista totale, affidabile e unificata dei tuoi dati cliente, inizia mettendo in corrispondenza e consolidando i tuoi dati di record in entità discrete, come descritto nel caso d'uso di Master Data Management.
Esplora ogni caso d'uso per scoprire cosa puoi realizzare e gli strumenti che puoi usare.
Governance dei dati
Implementare la governance basata su metadati che forniscono conoscenze di business e definiscono la protezione dei dati. Fornire asset di dati di alta qualità in cataloghi self-service. Automatizza l'applicazione della governance dei dati per la conformità normativa.
Servizio per questo caso d'uso IBM Knowledge Catalog.
Integrazione dati
Semplifica e automatizza l'accesso a tutti i dati, senza spostarli. Organizza i dati in un ambiente distribuito per creare una rete di informazioni immediatamente disponibili per i consumatori di dati.
Servizi per questo caso d'uso: Data Virtualization, DataStage, e IBM Knowledge Catalog.
Vedere caso d'uso di integrazione dati.
Master Data Management
Crea una vista consolidata dei clienti e registra i dati connettendo i dati tra i domini e associandoli per creare entità di dati master.
Servizio per questo caso di utilizzo: IBM Match 360 with Watson.
Vedere il caso d'usoMaster Data Management.
Crea e gestisci casi di utilizzo AI
Quando si implementano e si gestiscono i casi di utilizzo AI, è possibile risolvere le sfide di creazione di modelli, governance AI e gestione dei cicli di vita AI.
La creazione e la gestione dei casi di utilizzo AI su Cloud Pak for Data forniscono queste funzionalità principali per la gestione e l'automazione dei cicli di vita AI:
- Innovazione collaborativa
- Collabora con gli altri per scoprire informazioni dettagliate. Prepara i dati, analizza i dati e crea modelli con una serie di tool integrati per tutti i livelli di esperienza.
- Governance e conformità
- Tenere traccia e documentare la cronologia dettagliata dei modelli AI per garantire la conformità.
- Ciclo di vita unificato
- Automatizza la creazione, il test, la distribuzione e il monitoraggio di modelli AI.
Cloud Pak for Data offre due casi d'uso dell'IA da costruire e governare. Implementa ogni caso di utilizzo creando una o più istanze del servizio che forniscono funzioni e strumenti. Alcuni servizi sono inclusi in più casi di utilizzo.
È possibile iniziare con un caso di utilizzo e aggiungerne l'altro in base alle esigenze:
- Se si desidera un time - to - value più rapido, iniziare con la data science, come descritto nel caso di utilizzo di Data Science e MLOps.
- Se hai bisogno di assicurarti che i tuoi modelli siano conformi agli obiettivi e ai regolamenti della tua organizzazione, inizia a tenere traccia dei tuoi modelli, come descritto nel caso d'uso di governance AI.
Esplora ogni caso d'uso per scoprire cosa puoi realizzare e gli strumenti che puoi usare.
Data Science e MLOps
Rendere operativa l'analisi dei dati e la creazione dei modelli con un flusso di lavoro automatizzato che prepara i dati, crea, distribuisce, monitora e ricrea i modelli.
Servizi per questo caso d'uso: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog.
Governance dell'AI
Rendere operativa la governance AI con un flusso di lavoro automatico che applica correttezza, qualità e spiegabilità nei modelli.
Servizi per questo caso d'uso: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale e IBM Knowledge Catalog.
Vedere AI governance use case.
Ulteriori informazioni
- Che cos'è un tessuto di dati?
- Iscriversi alle versioni di prova di data fabric
- Caso d'uso di governance dei dati
- Caso di utilizzo integrazione dati
- Caso d'usoMaster Data Management
- Caso d'uso governance AI
- Caso d'uso Data Science e MLOps
- Che cos'è l'osservabilità dei dati?
- Esercitazioni sui casi di utilizzo
Argomento principale: Panoramica di Cloud Pak for Data as a Service