0 / 0
Torna alla versione inglese della documentazione
Caso d'uso di governance dei dati
Caso d'uso di governance dei dati

Caso d'uso di governance dei dati

Molte aziende hanno difficoltà a bilanciare i vantaggi di fornire l'accesso ai dati con la necessità di proteggere i dati sensibili. Cloud Pak for Data as a Service fornisce i metodi necessari alla tua azienda per automatizzare la governance dei dati in modo da poter garantire che i dati siano sia accessibili che protetti.

Guarda questo video per vedere il caso d'uso del data fabric per implementare una soluzione di governance dei dati in Cloud Pak for Data.

Questo video fornisce un metodo visivo come alternativa alla procedura scritta in questa documentazione.

Verifiche

Molte aziende devono affrontare le seguenti sfide di governance dei dati:

Fornire la privacy dei dati su larga scala
Le organizzazioni devono rispettare le normative sulla privacy dei dati per i dati nelle origini dati su più piattaforme cloud e on - premise.

Accesso ai dati di alta qualità
Le aziende devono fornire accesso ai dati aziendali di alta qualità in più team.

Creazione di un profilo cliente completo
I team devono creare viste accurate dei clienti su larga scala, in modo rapido, per ottimizzare i processi self-service e la gestione dei dati.

Utilizzo dei dati self-service
I consumatori di dati, come i data scientist, fanno fatica a trovare e utilizzare i dati di cui hanno bisogno.

Puoi risolvere queste sfide implementando un data fabric con Cloud Pak for Data as a Service.

Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank mentre il team di governance implementa la governance dei dati. Golden Bank ha una grande quantità di dati relativi a clienti e mutui che includono dati sensibili. La banca vuole garantire la qualità dei dati, mascherare i dati sensibili e renderli disponibili per l'uso in diversi reparti.

Processo

Il modo in cui si implementa la governance dei dati dipende dalle necessità della propria azienda. È possibile implementare la governance dei dati in modo lineare o iterativo. È possibile fare affidamento sulle funzioni predefinite e sulle risorse utente predefinite oppure personalizzare la propria soluzione.

Per implementare la governance dei dati, la propria organizzazione potrebbe seguire questo processo:

  1. Stabilire il vocabolario di business
  2. Definire regole per proteggere i dati
  3. Curare e consolidare i dati
  4. Condividere o utilizzare i dati

I servizi Watson Knowledge Catalog e Match 360 in Cloud Pak for Data as a Service forniscono tutti gli strumenti e i processi necessari alla tua azienda per implementare una soluzione di governance dei dati.

Immagine che mostra il flusso di asset nel caso di utilizzo governance dei dati

1. Definire il vocabolario aziendale

Per rispondere alle sfide, il team deve stabilire un vocabolario di business importando o creando risorse di governance che fungano da metadati per classificare e descrivere i dati:

  • Prima di poter automatizzare la privacy dei dati, il team deve accertarsi che i dati da controllare siano identificati in modo accurato.
  • Prima di analizzare la qualità dei dati, è necessario identificare il formato dei dati.
  • Per rendere i dati facili da trovare, il team deve assicurarsi che il contenuto dei dati sia descritto in modo accurato.

In questa prima fase del processo, il team di governance può creare le risorse utente di governance predefinite e creare risorse utente di governance personalizzate specifiche per l'organizzazione. È possibile creare risorse per descrivere il formato, il significato aziendale, la sensibilità, l'intervallo di valori e le politiche di governance dei dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Categorie Utilizzare la categoria predefinita per memorizzare risorse utente di governance.

Creare categorie per organizzare risorse utente di governance in una struttura gerarchica simile alle cartelle.

Aggiungere collaboratori con ruoli che definiscono le relative autorizzazioni sulle risorse utente nella categoria.
Si ha bisogno di più della categoria predefinita.

Si desidera un controllo dettagliato di chi può possedere, creare e visualizzare le risorse utente di governance.
Flussi di lavoro Utilizzare la configurazione del flusso di lavoro predefinita che non limita chi crea le risorse utente di governance o richiede revisioni.

Configurare i flussi di lavoro per le risorse utente di governance e designare chi può creare quali tipi di risorse utente di governance in quali categorie.
Si desidera controllare chi crea le risorse utente di governance.

Si desidera che le risorse utente di governance bozza vengano revisionate prima che vengano pubblicate.
Risorse utente di governance Utilizzare i termini di business, le classi di dati e le classificazioni predefiniti.

Creare risorse di governance che fungano da metadati per arricchire, definire e controllare gli asset di dati.
Si desidera aggiungere conoscenza e significato agli asset per aiutare le persone a comprendere i dati.

Si desidera migliorare l'analisi della qualità dei dati.
Knowledge Accelerators Importare una serie di risorse di governance predefinite per migliorare la classificazione dei dati, la conformità normativa, l'analitica self-service e altre operazioni di governance. È necessario un vocabolario standard per descrivere i problemi di business, le prestazioni di business, gli standard industriali e le normative.

Si desidera risparmiare tempo importando risorse di governance pre - create.


Esempio: vocabolario aziendale di Golden Bank

Il responsabile del team di governance presso Golden Bank inizia creando una categoria, Banking, per conservare le risorse utente di governance che il team intende creare. Il leader del team aggiunge il resto dei componenti del team di governance come collaboratori alla categoria Banking con il ruolo Editor in modo da disporre dell'autorizzazione per creare le risorse di governance. Quindi, il responsabile del team configura i flussi di lavoro in modo che un membro del team differente sia responsabile della creazione di ciascun tipo di risorsa utente. Tutti i flussi di lavoro richiedono una fase di approvazione da parte del team leader.

Un membro del team di governance importa una serie di termini di business da un foglio di calcolo. Alcuni dei termini di business distinguono tra clienti personali e commerciali. Un altro membro del team crea un dataset di riferimento, "Nomi client a livello di diamante", che contiene un elenco dei principali client commerciali. Un terzo componente del team crea una classe di dati personalizzata, "Client a livello di diamante" per identificare i client commerciali principali, in base al dataset di riferimento.

2. Definire le regole per proteggere i dati

Nella fase successiva del processo, il proprio team definisce le norme per garantire la conformità con le normative sulla privacy dei dati controllando chi può vedere quali dati. Il team crea regole di protezione dei dati per definire come proteggere i dati nei cataloghi gestiti. Il team può utilizzare queste regole di protezione dei dati per mascherare i dati sensibili in base al contenuto, al formato o al significato dei dati o all'identità degli utenti che accedono ai dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Regole di protezione dei dati Proteggere le informazioni sensibili da accessi non autorizzati nei cataloghi gestiti negando l'accesso ai dati, mascherando i valori dei dati o filtrando le righe negli asset di dati.

Mascherare in modo dinamico e coerente i dati nei cataloghi gestiti a livello granulare definito dall'utente.
È necessario applicare automaticamente la privacy dei dati nei cataloghi gestiti.

Si desidera conservare la disponibilità e l'utilità dei dati rispettando le normative sulla privacy.
Flussi di mascheramento Utilizzare le funzioni di mascheramento dei dati avanzate di conservazione del formato quando si estraggono copie o sottoinsiemi di dati di produzione. Sono necessari dati di addestramento e serie di test anonimi che conservino l'integrità dei dati.
Politiche e regole di governance Descrivere e documentare le linee guida, le normative, gli standard o le procedure per la sicurezza dei dati.

Descrivere il comportamento o le azioni richieste per implementare la politica di governance.
Si desidera che le persone che utilizzano i dati comprendano le politiche di governance dei dati.


Esempio: regole di protezione dei dati di Golden Bank

Per creare un modello predittivo per le approvazioni dei mutui, i data scientist di Golden Bank devono accedere ai dataset che includono dati sensibili. Ad esempio, i data scientist desiderano accedere alla tabella con i dati sui richiedenti del mutuo, che include una colonna con i numeri di previdenza sociale.

Un membro del team di governance crea una regola di protezione dati che maschera i numeri di previdenza sociale. Se la classe di dati assegnata di una colonna in un asset di dati è "US Social Security Number", i valori in tale colonna vengono sostituiti con 10 X.

Un membro del team di governance crea una politica che include la regola di protezione dei dati. La politica descrive i motivi aziendali per implementare la regola.

3. Curare i dati da condividere nei cataloghi

I data steward curano gli asset di dati di alta qualità nei progetti e li pubblicano nei cataloghi in cui le persone che hanno bisogno dei dati possono trovarli. Gli steward di dati arricchiscono gli asset di dati assegnando le risorse utente di governance come metadati che descrivono i dati e informano la ricerca semantica dei dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Metadata import Importare automaticamente i metadati tecnici per i dati associati a una connessione per creare gli asset di dati. È necessario creare molti asset di dati da una origine dati.

È necessario aggiornare gli asset di dati precedentemente importati.
Arricchimento dei metadati Creare il profilo di più asset di dati in una singola esecuzione per assegnare automaticamente classi di dati e identificare tipi di dati e formati di colonne.

Assegnare automaticamente i termini di business agli asset e generare suggerimenti di termini in base alla classificazione dei dati.

Eseguire nuovamente i lavori di importazione e arricchimento ad intervalli per rilevare e valutare le modifiche agli asset di dati.
È necessario curare e pubblicare molti asset di dati importati.
Analisi della qualità dei dati Eseguire l'analisi della qualità su più insiemi di dati in una singola esecuzione per rilevare la presenza di dimensioni comuni della qualità dei dati, come valori mancanti o violazioni delle classi di dati.
Traccia continuamente le modifiche al contenuto e alla struttura dei dati e analizza in modo ricorrente i dati modificati.
È necessario sapere se la qualità dei dati può influire sull'accuratezza dell'analisi dei dati o dei modelli.

Gli utenti devono identificare i dataset da correggere.
Explorer dei dati master Con l'explorer di dati master in IBM Match 360, gli utenti e i sistemi ricercano, visualizzano e analizzano le entità di dati master.

Gli utenti possono rilevare i dati master direttamente nello spazio in cui prevedono di utilizzarli.
Utenti e sistemi hanno bisogno di una vista totale dei dati.

Gli utenti e i sistemi devono ricercare, visualizzare e analizzare le entità di dati master.

Si desidera utilizzare le API per collegare le proprie applicazioni aziendali a dati master attendibili.


Esempio: consolidamento e gestione dei dati di Golden Bank

Gli steward di dati sul team di governance iniziano l'importazione dei metadati per creare asset di dati in un progetto. Dopo l'importazione dei metadati, Golden Bank ha due asset di dati che rappresentano tabelle con una colonna denominata "ID". Dopo l'arricchimento dei metadati, tali colonne sono chiaramente differenziate dai loro metadati assegnati:

  • A una colonna vengono assegnati i termini di business "Client commerciale" e "Identificativo azienda" e la classe di dati "Client a livello di diamante".
  • All'altra colonna vengono assegnati i termini aziendali "Identificativo personale" e "Privato" e la classe di dati "US Social Security Number".

Gli steward di dati eseguono analisi della qualità dei dati sugli asset di dati per assicurarsi che il punteggio di qualità dei dati complessivo superi la soglia Golden Bank del 95%.

I data engineer di Golden Bank combinano i dati dei clienti di diversi sistemi all'interno dell'azienda, nonché i dati esterni, con i dati dell'indice di affidabilità creditizia per risolvere le entità e creare una vista consolidata dei clienti. Gli ingegneri impostano e aggiungono asset ai dati master, associano attributi di asset di dati, pubblicano il modello di dati ed eseguono l'algoritmo di corrispondenza per preparare i dati da esplorare.

Il responsabile del team di governance crea un catalogo, "Mortgage Approval Catalog" e aggiunge gli steward di dati e i data scientist come collaboratori del catalogo. Gli steward di dati pubblicano gli asset di dati che hanno creato nel progetto nel catalogo.

4. Condividi o gestisci i tuoi dati

Il catalogo aiuta i tuoi team a comprendere i tuoi dati e rende disponibili i dati giusti per il corretto utilizzo. I data scientist e altri tipi di utenti possono aiutare se stessi a ottenere i dati di cui hanno bisogno, pur restando conformi alle politiche di accesso e protezione dei dati aziendali. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa è possibile utilizzare Cosa puoi fare tu Migliore da utilizzare quando
Cataloghi Organizza gli asset da condividere tra i collaboratori della tua azienda.

Approfitta della ricerca semantica basata sull'AI e dei suggerimenti per aiutare gli utenti a trovare ciò di cui hanno bisogno.
Gli utenti devono comprendere, collaborare, arricchire e accedere facilmente ai dati di alta qualità.

Si desidera aumentare la visibilità dei dati e la collaborazione tra gli utenti di business.

Gli utenti devono visualizzare, accedere, manipolare e analizzare i dati senza comprenderne il formato fisico o l'ubicazione e senza doverli spostare o copiare.

Si desidera che gli utenti migliorino gli asset valutando e revisionando gli asset.
ricerca globale Ricercare gli asset in tutti i progetti, cataloghi e spazi di distribuzione a cui si ha accesso.

Ricercare le risorse utente di governance nelle categorie a cui si ha accesso.
È necessario trovare i dati o un altro tipo di asset o una risorsa utente di governance.
Data Refinery Ripulire i dati per correggere o rimuovere i dati non corretti, incompleti, formattati in modo non corretto o duplicati.

Formare i dati per personalizzarli filtrando, ordinando, combinando o rimuovendo le colonne.
È necessario migliorare la qualità o l'utilità dei dati.


Esempio: catalogo di Golden Bank

I data scientist trovano gli asset di dati di cui hanno bisogno nel catalogo e li copiano in un progetto. Nel loro progetto, i data scientist possono perfezionare i dati per prepararli all'addestramento di un modello.

Esercitazioni per la governance dei dati

Supporto didattico Descrizione Esperienza per l'esercitazione
Curare dati di alta qualità Creare asset di dati di alta qualità arricchendo i dati ed eseguendo l'analisi della qualità dei dati. Esegui gli strumenti di arricchimento Metadata import e Metadata.
Proteggi i tuoi dati Controlla l'accesso ai dati in Cloud Pak for Data as a Service. Creare regole di protezione dati.
Utilizzo dei dati Trova, forma e analizza i dati. Esplorare un catalogo ed eseguire lo strumento Data Refinery .
Gestire i dati virtualizzati Arricchire i dati virtualizzati e garantire la protezione dei dati virtuali. Utilizzare l'interfaccia, i progetti e i cataloghi Watson Query per gestire dati virtualizzati.
Configurazione di una vista a 360 gradi Impostare, associare e modellare i dati per creare una vista consolidata dei clienti. Utilizzare l'interfaccia di trascinamento e rilascio Match 360 per configurare la vista consolidata.


Ulteriori informazioni sulla governance dei dati

Argomento principale: Panoramica della soluzione Data fabric