Esercitazione sulla governance dei dati: gestione dei dati virtualizzati
Questa Eseguire questa esercitazione per gestire i dati virtualizzati dopo aver completato l'esercitazione Curate high quality data, Protect your data tutoriale Virtualize external data tutorial con il caso d'uso Data integration della versione di prova di data fabric. Il tuo obiettivo è proteggere i dati virtuali che contengono i richiedenti e le domande di mutuo e i loro punteggi di credito per l'accesso non autorizzato. Alcune informazioni personali, come il numero di previdenza sociale, devono essere mascherate in modo che tutti i dipendenti di Golden Bank non abbiano accesso a tali informazioni personali.
La storia dell'esercitazione è che Golden Bank ha diversi reparti che devono accedere a dati ipotecari dei clienti di alta qualità memorizzati in tre origini dati esterne. In qualità di Data Steward del team di governance, è necessario arricchire i dati virtualizzati e assicurarsi che i dati virtualizzati siano protetti.
La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Aggiungerai dati virtuali al progetto, quindi arricchirai tali dati con termini di business e vedrai come le regole di protezione dei dati di IBM Knowledge Catalog mascherano i dati tramite Cloud Pak for Data as a Service. Fare clic sull'immagine per visualizzare un'immagine più grande.
Anteprima dell'esercitazione
In questa esercitazione, verranno completate le seguenti attività:
- Impostare i requisiti.
- Attività 1: abilitare la gestione dei dati virtualizzati
- Attività 2: eseguire una query SQL su tabelle virtuali
- Attività 3: copiare i dati virtualizzati nel progetto.
- Attività 4: arricchire i dati virtualizzati
- Attività 5: visualizzare i risultati dell'arricchimento dei metadati.
- Attività 6: pubblicare tabelle virtuali in un catalogo.
- Ripulisci
Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàCloud Pak for Data.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Imposta i requisiti
Completare le esercitazioni prerequisite
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 00:27.
Completare le seguenti esercitazioni:
- Esercitazione Virtualizzare i dati esterni per creare tabelle virtuali e unire le viste dai dati memorizzati in tre origini esterne.
- Esercitazione Curate high quality data per importare e arricchire gli asset di dati e pubblicarli in un catalogo.
- Esercitazione Proteggi i tuoi dati per creare regole di protezione dei dati per proteggere i dati.
Attività 1: abilitare la governance dei dati virtualizzati
Sono necessari due passi per abilitare la governance dei dati virtualizzati:
- Applica regole di protezione dati in Watson Query.
- Configurare l'autorizzazione tra IBM Knowledge Catalog e Watson Query.
Applica regole di protezione dei dati
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 01:02.
Seguire questa procedura per applicare le regole di protezione dei dati in Watson Query:
Nel Menu di navigazione , scegliere Dati > Data virtualization.
Se viene visualizzata una notifica a Impostare un catalogo primario per applicare la governance, fare clic su Vai a Governance. Se questo messaggio non viene visualizzato, dal menu del servizio, fare clic su Amministrazione> Impostazioni servizio, quindi fare clic sulla scheda Governance .
Abilitare l'opzione Applica regole di protezione dei dati per gli oggetti virtuali e fare clic su Salva.
Dal menu del servizio, ritorna a Virtualizzazione> Origini dati.
Controlla i tuoi progressi
La seguente immagine mostra la scheda Governance con l'applicazione della politica abilitata. Successivamente, è necessario configurare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.
Controlla i tuoi progressi
La seguente immagine mostra la pagina Autorizzazioni in IBM Cloud con l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization. Ora è possibile interrogare le tabelle virtuali governate in Data Virtualization.
Attività 2: esecuzione di una query SQL sulle tabelle virtuali gestite
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 02:00.
Con le regole di protezione dei dati in vigore, le tabelle virtuali sono regolate da tali regole. Attenersi alla seguente procedura per eseguire una query SQL su una tabella virtuale gestita:
Dal menu del servizio Watson Query , fare clic su Esegui SQL
Copiare e incollare la seguente istruzione SELECT per la nuova interrogazione. Sostituisci
<your schema>
con il nome schema che hai notato in precedenza.SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
La query è simile a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
Fare clic su Esegui tutto.
Una volta completata la query, selezionare la query nella scheda Cronologia . Nella scheda Risultati , è possibile vedere che la tabella è filtrata solo per gli aspiranti dello stato della California. Le regole di protezione dei dati si applicano in Watson Query, anteprima del catalogo, download del catalogo, Data Refinerye anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video all'indirizzo 02:47 per vedere cosa vedono gli altri utenti quando eseguono la query SQL.
Controlla i tuoi progressi
La seguente immagine mostra i risultati della query SQL dalla prospettiva di un altro utente. Ora si è pronti a copiare le tabelle virtuali nel progetto.
Attività 3: copiare i dati virtuali nel progetto
Per visualizzare in anteprima questa attività, guardare il video a partire dalle 03:02.
Nell'esercitazione Virtualizza dati esterni , sono state create tabelle virtuali e viste di unione virtuali e copiate nel progetto di integrazione dati. Se si desidera utilizzare tale progetto per completare questa esercitazione, passare all' Attività 3. Se si desidera utilizzare il progetto di governance dei dati per completare questa esercitazione, attenersi alla seguente procedura:
Dal menu del servizio, fare clic su Virtualizzazione> Dati virtualizzati
Selezionare le seguenti tabelle:
- APPLICAZIONE_MUTUO
- IPOTECA_ASPIRANTE
- PUNTO_CREDITO
- APPLICANTI_APPLICAZIONI_UNITI
- APPLICANTI_APPLICATIONS_CREDIT_SCORE_UNITI
Fare clic su Assegna.
Per il Progetto, selezionare Data governance.
Fare clic su Assegna.
Una volta assegnati correttamente gli oggetti virtuali, passare al proprio progetto.
Nel progetto Data governance , fare clic sulla scheda Asset . Le tabelle di dati virtuali iniziano con
<your schema>
.Aprire una delle tabelle di dati virtuali. Ad esempio, fare clic sulla tabella virtuale APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNITO per visualizzarla.
Fornire le proprie credenziali per accedere all'asset di dati.
Per il Metodo di autenticazione, selezionare Chiave API.
Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data .
Fai clic su CONNETTI. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video su 04:09 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella di dati virtuali.
Controlla i tuoi progressi
La seguente immagine mostra la tabella virtuale con una colonna mascherata nel progetto dalla prospettiva di un utente differente. Ora è possibile arricchire i dati.
Attività 4: arricchire le tabelle di dati virtuali
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 04:00.
È possibile arricchire gli asset di dati con informazioni che consentono agli utenti di trovare i dati più rapidamente. Gli utenti possono utilizzare gli arricchimenti per decidere se i dati sono appropriati per l'attività a portata di mano, se possono considerare attendibili i dati e come gestire i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni. Seguire questa procedura per arricchire le tabelle di dati virtuali:
Fare clic su Data governance nella traccia di navigazione per tornare al progetto
Sul Risorse scheda, fare clic Nuova risorsa > Arricchisci le risorse di dati con metadati .
Per il nome, copiare e incollare il seguente testo:
Virtual mortgage data - metadata enrichment
Fare clic su Avanti per continuare.
Fare clic su Seleziona dati dal progetto.
Selezionare Asset dati.
Fare clic sulla casella di controllo accanto ai seguenti asset:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Fare clic su Seleziona.
Fare clic su Avanti per continuare con l'obiettivo di arricchimento.
Selezionare tutti gli obiettivi di arricchimento:
- Dati del profilo
- Assegna termini
- Esegui analisi della qualità di base
Per Categorie, fare clic su Seleziona categorie.
Selezionare solo [ uncategorized] e Banking.
Fare clic su Seleziona.
Per Campionamento, selezionare Di base.
Fare clic su Avanti per continuare con la pianificazione.
Fare clic su Avanti per continuare la revisione.
Fare clic su Crea.
Viene visualizzato l'asset di arricchimento dei metadati, ma il completamento del lavoro potrebbe richiedere diversi minuti. Fare clic sull'icona Aggiorna per visualizzare la modifica di stato da In coda a In corso a Terminata. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.
Controlla i tuoi progressi
La seguente immagine mostra l'arricchimento dei metadati completato. Ora è possibile esplorare gli asset di dati arricchiti.
Attività 5: visualizzare i risultati dell'arricchimento dei metadati
Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 05:00.
Una volta completata l'esecuzione dell'arricchimento dei Metadati, attieniti alla seguente procedura per visualizzare i dati arricchiti:
Dalla schermata Virtual mortgage data - metadata enrichment , fai clic sulla scheda Columns .
Cercare
mortgage_applicant
.Nell'elenco di Colonne, individuare la colonna EMAIL_ADDRESS per l'asset your-schema.MORTGAGE_APPLICANT .
Fai clic sul menu Overflow alla fine di EMAIL_ADDRESS per la tua riga your_schema.MORTGAGE_APPLICANT e scegli View column details.
Nel pannello laterale della scheda Dettagli , vengono visualizzate informazioni di creazione profili quali: Formato, Distribuzione frequenza, Statistiche.
Nel pannello laterale, fare clic sulla scheda Governance . Questa scheda include le classi di dati e i termini di business che sono stati assegnati automaticamente durante l'arricchimento dei metadati. È inoltre possibile visualizzare i termini di business e le classi di dati suggeriti e assegnarli manualmente.
Esaminare eventuali termini di business o classi di dati suggeriti e assegnarli manualmente. Ad esempio, è possibile visualizzare Indirizzo come termine di business suggerito.
Fare clic su Termini di business suggeriti.
Per Indirizzo, fare clic su Assegna.
Fare clic su Classi dati consigliate.
Per Testo, fare clic su Assegna.
Alla fine della colonna EMAIL_ADDRESS per la tua riga dell'asset your_schema.MORTGAGE_APPLICANT , fai clic sul menu Overflow e scegli View data quality details.
Visualizzare il punteggio di qualità dei dati. IBM Knowledge Catalog genera automaticamente un punteggio di qualità dei dati per ogni colonna e asset di dati analizzando ogni valore in ogni record in base alle dimensioni preintegrate.
Fare clic sulla X per chiudere la finestra Qualità dati .
Cercare
credit_score
.Per la colonna CITY per l'asset your_schema.CREDIT_SCORE , fare clic sul menu Overflow e scegliere Contrassegna come revisionato.
Fai clic sulla scheda Assets.
Nell'elenco di Asset, per il proprio asset your_schema.MORTGAGE_APPLICANT , fare clic sul menu Overflow e scegliere Visualizza dettagli asset.
Nel pannello laterale, fare clic sulla scheda Governance per visualizzare qualsiasi termine di business che è stato assegnato automaticamente.
Fare clic sull'icona Aggiungi (oppure potrebbe essere visualizzata l'icona Modifica ) per assegnare manualmente i termini di business.
Cercare
social
. Se non viene visualizzato alcun risultato, assicurarsi che l'elenco a discesa sia impostato su Tutti i termini invece di Termini suggeriti.Selezionare Social Security Number.
Fare clic su Assegna.
Controlla i tuoi progressi
La seguente immagine mostra gli asset di dati revisionati e arricchiti. Il passo successivo è quello di pubblicare i dati arricchiti in un catalogo da condividere con la tua organizzazione.
Attività 6: pubblicazione di tabelle virtuali in un catalogo
Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 7:18.
Ora che i dati virtualizzati sono arricchiti con termini di business, seguire questa procedura per pubblicare le relative tabelle virtuali in un catalogo:
Fare clic su Data governance nella traccia di navigazione per tornare al progetto.
Fai clic sulla scheda Assets.
Passare a Dati> Asset dati.
Fare clic sulla casella di controllo accanto ai seguenti asset:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Fare clic su Pubblica nel catalogo.
Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.
Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.
Esaminare gli asset e fare clic su Pubblica.
In Mortgage Approval Catalog, cercare
<your-schema>
.Aprire una delle tabelle virtuali. Se richiesto, fornire le proprie credenziali:
Per il Metodo di autenticazione, selezionare Chiave API.
Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data .
Fare clic sulla scheda Asset per visualizzare i dati. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video alle 08:17 per vedere cosa vedono gli altri utenti che tentano di accedere alla tabella di dati virtuali nel catalogo.
Controlla i tuoi progressi
La seguente immagine mostra l'anteprima dei dati della tabella virtuale nel catalogo dalla prospettiva dell'utente.
Come data engineer e data steward presso Golden Bank, hai arricchito i dati virtualizzati per garantire che i dati virtualizzati siano protetti.
Ripulitura (facoltativo)
Se si desidera riprendere le esercitazioni nel caso di utilizzo di Data Governance, fare riferimento alla sezione Cleanup in ciascuna delle esercitazioni prerequisite:
Passi successivi
Prova queste esercitazioni:
Registrati per un altro caso di utilizzo di Data fabric.
Ulteriori informazioni
Argomento principale: Esercitazioni del caso d'uso