0 / 0
Torna alla versione inglese della documentazione
Caso di utilizzo di Data governance and privacy
Caso di utilizzo di Data governance and privacy

Caso di utilizzo di Data governance and privacy

Molte imprese lottano per bilanciare i benefici di fornire l'accesso ai dati con la necessità di proteggere i dati sensibili. Cloud Pak for Data as a Service fornisce i metodi che la tua azienda ha bisogno di automatizzare la governance dei dati e la privacy in modo da garantire che i dati siano accessibili e protetti.

Guarda questo video per vedere il caso di utilizzo del tessuto dati per implementare una soluzione Data governance and privacy in Cloud Pak for Data.

Questo video fornisce un metodo visivo in alternativa a seguire le fasi scritte in questa documentazione.

Verifiche

Molte imprese affrontano le seguenti sfide di governance dei dati e privacy:

Fornire la privacy dei dati in scala
Organizzazioni devono rispettare le normative sulla privacy dei dati per i dati in fonti di dati attraverso più piattaforme cloud e on - premises.

L'accesso ai dati di alta qualità dei dati
Le organizzazioni devono fornire l'accesso a dati aziendali di alta qualità attraverso più team.

Fornire il consumo di dati self-service
I consumatori di dati, come gli scienziati dei dati, lottano per trovare e utilizzare i dati di cui hanno bisogno.

È possibile risolvere queste sfide implementando un tessuto di dati con Cloud Pak for Data as a Service.

Esempio: le sfide della Golden Bank

Segui la storia di Golden Bank mentre il team di governance implementa la governance dei dati. Golden Bank ha una grande quantità di dati sui clienti e sui mutui che include dati sensibili. La banca vuole garantire la qualità dei dati, mascherare i dati sensibili e renderla disponibile per l'utilizzo in diversi dipartimenti.

Processo

Per implementare la governance dei dati e la privacy, la tua organizzazione può seguire questo processo:

  1. Impostare un framework di governance
  2. Crea regole per proteggere i tuoi dati
  3. Curare i dati da condividere nei cataloghi
  4. Trova e utilizza i dati

Il servizio Watson Knowledge Catalog in Cloud Pak for Data as a Service fornisce tutti gli strumenti e i processi di cui la tua organizzazione ha bisogno per implementare una soluzione di gestione dei dati e privacy.

Immagine che mostra il flusso di attività nel caso di governance dei dati e di utilizzo della privacy

1. Imposta un quadro di governance

Per soddisfare tutte e tre le sfide, il tuo team deve impostare un framework di artefatti di governance che fungono da metadati per classificare e descrivere i dati:

  • Prima di poter automatizzare la privacy dei dati, il tuo team deve garantire che i dati da controllare siano accuratamente identificati.
  • Prima di poter analizzare la qualità dei dati, è necessario identificare il formato dei dati.
  • Per rendere i dati facili da trovare, il tuo team deve garantire che il contenuto dei dati sia accuratamente descritto.

In questo primo passo del processo, il tuo team di governance può costruire sulla fondazione degli artefatti di governance predefiniti e creare artefatti di governance personalizzati che siano specifici per la tua organizzazione. È possibile creare artefatti per descrivere il formato, il significato aziendale, la sensibilità, la gamma di valori e le politiche di governance dei dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Categorie Utilizza la categoria predefinita per memorizzare i tuoi manufatti di governance.

Crea categorie per organizzare artefatti di governance in una struttura gerarchica simile alle cartelle.

Aggiungi collaboratori con ruoli che definiscono i propri permessi sui manufatti della categoria.
Hai bisogno di più della categoria predefinita.

Si desidera un controllo finalizzato di chi può possedere, autore e visualizzare artefatti di governance.
Flussi di lavoro Utilizzare la configurazione del flusso di lavoro predefinita che non limita chi crea artefatti di governance o richiede recensioni.

Configurare i flussi di lavoro per gli artefatti di governance e designare chi può creare quali tipi di artefatti di governance in quali categorie.
Vuoi controllare chi crea artefatti di governance.

Vuoi che i progetti di artefatti di governance vengano revisati prima di essere pubblicati.
Risorse utente di governance Utilizzare le classi di dati e le classificazioni predefinite.

Creare artefatti di governance che fungono da metadati per arricchire, definire e controllare i beni dati.
Vuoi aggiungere conoscenza e significato agli asset per aiutare le persone a comprendere i dati.

Vuoi migliorare l'analisi della qualità dei dati.
Knowledge Accelerators Importare una serie di artefatti di governance predefiniti per migliorare la classificazione dei dati, la conformità normativa, l'analisi self-service e le altre operazioni di governance. Hai bisogno di un vocabolario standard per descrivere le problematiche di business, le prestazioni aziendali, gli standard di settore e le normative.

Vuoi risparmiare tempo importando artefatti di governance pre - creati.


Esempio: Quadro di governance della Golden Bank

Il leader del team di governance alla Golden Bank inizia creando una categoria, Banking, per tenere gli artefatti di governance che il team prevede di creare. Il team leader aggiunge il resto dei membri del team di governance come collaboratori alla categoria Banking con il ruolo Editor in modo da avere il permesso di creare artefatti di governance. Poi, il leader del team configura i flussi di lavoro in modo che un diverso membro del team sia responsabile della creazione di ogni tipo di manufatto. Tutti i flussi di lavoro richiedono un passo di approvazione da parte del team leader.

Un membro del team di governance importa una serie di termini aziendali da un foglio di calcolo. Alcuni termini aziendali si differenziano tra i clienti personali e commerciali. Un altro membro del team crea un dataset di riferimento, "nomi client di livello di diamante", che contiene un elenco dei principali clienti commerciali. Un terzo membro del team crea una classe di dati personalizzata, "Diamond - level clients" per identificare i principali clienti commerciali, in base al dataset di riferimento.

2. Creare regole per proteggere i tuoi dati

Nel passo successivo del processo, il vostro team stabilisce delle regole per garantire la conformità alle normative sulla privacy dei dati controllando chi può vedere quali dati. Il tuo team crea regole di protezione dei dati che proteggono i dati attraverso la piattaforma. Il tuo team può utilizzare queste regole di protezione dei dati per mascherare i dati sensibili in base al contenuto, al formato o al significato dei dati, o all'identità degli utenti che accedono ai dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Regole di protezione dei dati Proteggere le informazioni sensibili dall'accesso non autorizzato, negando l'accesso o mascherando i valori dei dati in asset dati.

Dati sulle maschere dinamicamente e costantemente maschili a livello granulare definito dall'utente.
È necessario far rispettare automaticamente la privacy dei dati attraverso la piattaforma.

Si desidera conservare la disponibilità e l'utilità dei dati mentre si rispettano anche le normative sulla privacy.
Flussi di mascheramento Utilizzare le funzionalità di mascheramento dei dati in formato avanzato quando si estrae copie o sottoinsiemi di dati di produzione. Servono dati di formazione anonimi e set di test che conservano l'integrità dei dati.
Politiche e regole di governance Descrivere e documentare le linee guida, le normative, le norme o le procedure della propria organizzazione per la sicurezza dei dati.

Descrivere i comportamenti o le azioni richieste per implementare la politica di governance.
Vuoi che le persone che usano i dati comprendano le politiche di governance dei dati.


Esempio: regole di protezione dei dati della Golden Bank

Per creare un modello predittivo per le approvazioni dei mutui, gli scienziati dei dati della Golden Bank hanno bisogno di accedere ai dataset che includono i dati sensibili. Ad esempio, gli scienziati dei dati vogliono accedere alla tabella con i dati relativi ai richiedenti ipotecari, che include una colonna con i numeri di sicurezza sociale.

Un membro del team di governance crea una regola di protezione dei dati che maschera i numeri della sicurezza sociale. Se la classe dati assegnata di una colonna in un asset dati è "US Social Security Number", i valori in tale colonna vengono sostituiti con 10 Xs.

Un membro del team di governance crea una politica che include la regola di protezione dei dati. La politica descrive i motivi di business per l'implementazione della regola. In seguito, quando gli utenti, come gli scienziati dei dati, vedono l'icona maschuta su una colonna di dati, possono visualizzare la regola di protezione dei dati, quindi visualizzare la politica associata per capire perché i dati sono mascheri.

3. Curare i dati da condividere nei cataloghi

I dati steward curano i beni dati di alta qualità nei progetti e li pubblicano ai cataloghi dove le persone che hanno bisogno dei dati li possono trovare. I dati steward arricchisce l'asset dei dati assegnando manufatti di governance come metadati che descrivono i dati e informa la ricerca semantica dei dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Metadata import Importare automaticamente i metadati tecnici per i dati associati ad una connessione per creare asset dati. È necessario creare molti asset dati da un'origine dati.

È necessario aggiornare gli asset dati precedentemente importati.
Arricchimento dei metadati Profilare più asset dati in un'unica esecuzione per assegnare automaticamente le classi di dati e identificare i tipi di dati e i formati di colonne.

Assegnare automaticamente i termini aziendali agli asset e generare suggerimenti a termine in base alla classificazione dei dati.

Rerun l'importazione e i lavori di arricchimento a intervalli per scoprire e valutare le modifiche agli asset dati.
È necessario curare e pubblicare molti asset di dati importati.
Analisi della qualità dei dati Eseguire analisi di qualità su più set di dati in un'unica esecuzione per effettuare la scansione di dimensioni comuni della qualità dei dati come i valori mancanti o le violazioni della classe dati.
Continuamente traccia modifiche al contenuto e alla struttura dei dati e analizzando in modo ricorrente i dati modificati.
Devi sapere se la qualità dei tuoi dati potrebbe influenzare l'accuratezza della tua analisi dei dati o dei modelli.

I tuoi utenti devono identificare quali data set per rimediare.
Cataloghi Pubblicare gli asset curati da condividere tra i collaboratori nella tua organizzazione. È necessario un repository centrale per memorizzare i beni dati che visualizza i metadati associati, le relazioni e la cronologia degli asset.


Esempio: la curazione dei dati della Golden Bank

I dati steward sul team di governance iniziano l'importazione dei metadati per creare asset dati in un progetto. Dopo l'importazione dei metadati, Golden Bank dispone di due asset dati che rappresentano tabelle con una colonna denominata "ID". Dopo l'arricchimento dei metadati, quelle colonne sono chiaramente differenziate dai metadati assegnati:

  • A una colonna vengono assegnati i termini aziendali "Commercial client" e "Company identificativo", e la classe dati "Diamond - level clients".
  • All'altra colonna vengono assegnati i termini aziendali "Identificativo personale" e "Private individuale" e la classe dati "US Social Security Number".

I dati orientano l'analisi della qualità dei dati sull'asset dei dati per assicurarsi che il punteggio complessivo di qualità dei dati superi la soglia della Golden Bank del 95%.

Il leader del team di governance crea un catalogo, "Mutuo Approvazione Catalogo" e aggiunge i dati steward e gli scienziati dei dati come collaboratori di catalogo. Gli steward dati pubblicano gli asset dati che hanno creato nel progetto nel catalogo.

4. Trova e utilizza i dati

Il catalogo aiuta le tue squadre a capire i tuoi dati e rende disponibili i dati giusti per l'uso giusto. Gli scienziati dei dati e gli altri tipi di utenti possono aiutare se stessi ai dati di cui hanno bisogno mentre rimangono conformi alle politiche di accesso e protezione dei dati aziendali. Possono aggiungere asset di dati da un catalogo in un progetto, dove collaborano per preparare, analizzare e modellare i dati.

Cosa puoi utilizzare Cosa puoi fare tu Meglio utilizzare quando
Cataloghi Organizza i tuoi asset da condividere tra i collaboratori nella tua organizzazione.

Prendi vantaggio dalla ricerca semantica alimentata da AI e consigli per aiutare gli utenti a trovare ciò di cui hanno bisogno.
I tuoi utenti hanno bisogno di comprendere facilmente, collaborare, arricchire e accedere ai dati di alta qualità.

Vuoi aumentare la visibilità dei dati e la collaborazione tra gli utenti aziendali.

Hai bisogno di utenti per visualizzare, accedere, manipolare e analizzare i dati senza capire il proprio formato fisico o la propria posizione, e senza doverlo spostare o copiarlo.

Vuoi che gli utenti potenziino asset per abilitazione e revisione degli asset.
ricerca globale Cerca asset attraverso tutti i progetti, i cataloghi e gli spazi di distribuzione a cui si ha accesso.

Ricerca artefatti di governance attraverso le categorie a cui si ha accesso.
È necessario trovare dati o un altro tipo di asset, o un artefatto di governance.
Data Refinery Eliminare i dati per correggere o rimuovere i dati errati, incompleti, formattati in modo non corretto o duplicato.

Dati sulle scimmie per personalizzarlo filtrando, smistando, combinando o rimuovendo colonne.
È necessario migliorare la qualità o l'utilità dei dati.


Esempio: catalogo della Golden Bank

Gli scienziati dei dati trovano gli asset dati di cui hanno bisogno nel catalogo e copiano tali asset in un progetto. Nel loro progetto, gli scienziati dei dati possono perfezionare i dati per prepararlo alla formazione di un modello.

Esercitazioni per la privacy dei dati e la governance

Supporto didattico Descrizione Competenze per il tutorial
Fidati dei tuoi dati Creare asset dati attendibili arricchendo i tuoi dati e eseguendo l'analisi della qualità dei dati. Eseguire gli strumenti di arricchimento di Metadata import e Metadati.
Proteggi i tuoi dati Controllare l'accesso ai dati attraverso Cloud Pak for Data as a Service. Creare regole di protezione dei dati.
Conosci i tuoi dati Valutare, condividere, dare forma e analizzare i dati. Esplora un catalogo e esegue lo strumento Data Refinery .
Governare i dati virtualizzati Arricchire i dati virtualizzati e garantire che i dati virtuali siano protetti. Utilizzare l'interfaccia Watson Query , i progetti e i cataloghi per governare i dati virtualizzati.


Ulteriori informazioni sulla privacy dei dati e sulla governance

Argomento principale: Panoramica della soluzione del fabric dei dati