Questa esercitazione consente di governare i dati virtualizzati dopo aver completato le esercitazioni Curate i dati di alta qualità, Proteggete i vostri dati e Virtualizzate i dati esterni con il caso d'uso dell'integrazione dei dati della sperimentazione del data fabric. Il tuo obiettivo è proteggere i dati virtuali che contengono i richiedenti e le domande di mutuo e i loro punteggi di credito per l'accesso non autorizzato. Alcune informazioni personali, come il numero di previdenza sociale, devono essere mascherate in modo che tutti i dipendenti di Golden Bank non abbiano accesso a tali informazioni personali.
La storia dell'esercitazione è che Golden Bank ha diversi reparti che devono accedere a dati ipotecari dei clienti di alta qualità memorizzati in tre origini dati esterne. In qualità di Data Steward del team di governance, è necessario arricchire i dati virtualizzati e assicurarsi che i dati virtualizzati siano protetti.
La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Aggiungerai dati virtuali al progetto, quindi arricchirai tali dati con termini di business e vedrai come le regole di protezione dei dati di IBM Knowledge Catalog mascherano i dati tramite Cloud Pak for Data as a Service. Fare clic sull'immagine per visualizzare un'immagine più grande.
Anteprima dell'esercitazione
In questa esercitazione, verranno completate le seguenti attività:
- Impostare i requisiti.
- Attività 1: abilitare la gestione dei dati virtualizzati
- Attività 2: eseguire una query SQL su tabelle virtuali
- Attività 3: copiare i dati virtualizzati nel progetto.
- Attività 4: arricchire i dati virtualizzati
- Attività 5: visualizzare i risultati dell'arricchimento dei metadati.
- Attività 6: pubblicare tabelle virtuali in un catalogo.
- Ripulisci
Guardate questo video per vedere un'anteprima dei passaggi di questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.
Utilizzare il video immagine - in - immagine
La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:
Ottieni aiuto nella community
Se si ha bisogno di aiuto con questa esercitazione, è possibile porre una domanda o trovare una risposta nella sezione 'Cloud Pak for Data Forum di discussione della comunità.
Configurare le finestre del browser
Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.
Imposta i requisiti
Completare le esercitazioni prerequisite
Per vedere un'anteprima di questo compito, guardate il video a partire da 00:27.
Completare le seguenti esercitazioni:
- Esercitazione Virtualizzare i dati esterni per creare tabelle virtuali e unire le viste dai dati memorizzati in tre origini esterne.
- Esercitazione Curate high quality data per importare e arricchire gli asset di dati e pubblicarli in un catalogo.
- Esercitazione Proteggi i tuoi dati per creare regole di protezione dei dati per proteggere i dati.
Base Premium Standard Se non diversamente specificato, queste informazioni si applicano a tutte le edizioni di IBM Knowledge Catalog.
Attività 1: abilitare la governance dei dati virtualizzati
Sono necessari due passi per abilitare la governance dei dati virtualizzati:
- Applicare le regole di protezione dei dati nella Data Virtualization.
- Impostare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.
Applica regole di protezione dei dati
Per avere un'anteprima di questo compito, guardate il video a partire da 01:02.
Seguite questi passaggi per applicare le regole di protezione dei dati in Data Virtualization:
Dal menu di navigazione ', scegliere Dati > Data virtualization.
Se viene visualizzata una notifica a Impostare un catalogo primario per applicare la governance, fare clic su Vai a Governance. Se non viene visualizzato questo messaggio, dal menu del servizio, fare clic su Amministrazione > Impostazioni del servizio, quindi fare clic sulla scheda Governance.
Abilitare l'opzione Applica regole di protezione dei dati per gli oggetti virtuali e fare clic su Salva.
Dal menu del servizio, ritorna a Virtualizzazione> Origini dati.
Controllare i progressi
La seguente immagine mostra la scheda Governance con l'applicazione della politica abilitata. Successivamente, è necessario configurare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.
Controllare i progressi
La seguente immagine mostra la pagina Autorizzazioni in IBM Cloud con l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization. Ora è possibile interrogare le tabelle virtuali governate in Data Virtualization.
Attività 2: esecuzione di una query SQL sulle tabelle virtuali gestite
Per vedere un'anteprima di questo compito, guardate il video a partire da 02:20.
Con le regole di protezione dei dati in vigore, le tabelle virtuali sono regolate da tali regole. Attenersi alla seguente procedura per eseguire una query SQL su una tabella virtuale gestita:
Dal menu del servizio Data Virtualization, fare clic su Esegui SQL.
'Copiare e incollare la seguente istruzione SELECT per la nuova interrogazione. Sostituisci
<your schema>
con il nome schema che hai notato in precedenza.SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
La vostra query è simile a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
'Fare clic su Esegui tutto.
Una volta completata la query, selezionare la query nella scheda Cronologia . Nella scheda Risultati , è possibile vedere che la tabella è filtrata solo per gli aspiranti dello stato della California. Le regole di protezione dei dati si applicano alla Data Virtualization, all'anteprima del catalogo, al download del catalogo, alla Data Refinery e all'anteprima delle risorse del progetto. La regola non si applica al proprietario dell'asset. Guardate il video a 02:47 per vedere cosa vedono gli altri utenti quando eseguono la query SQL.
Controllare i progressi
La seguente immagine mostra i risultati della query SQL dalla prospettiva di un altro utente. Ora si è pronti a copiare le tabelle virtuali nel progetto.
Attività 3: copiare i dati virtuali nel progetto
Per vedere un'anteprima di questo compito, guardate il video a partire da 03:02.
Nell'esercitazione Virtualizza dati esterni , sono state create tabelle virtuali e viste di unione virtuali e copiate nel progetto di integrazione dati. Se si desidera utilizzare tale progetto per completare questa esercitazione, passare all' Attività 3. Se si desidera utilizzare il progetto di governance dei dati per completare questa esercitazione, attenersi alla seguente procedura:
Nel menu di servizio, fare clic su Virtualizzazione > Dati virtualizzati.
Selezionare le seguenti tabelle:
- APPLICAZIONE_MUTUO
- IPOTECA_ASPIRANTE
- PUNTO_CREDITO
- APPLICANTI_APPLICAZIONI_UNITI
- APPLICANTI_APPLICATIONS_CREDIT_SCORE_UNITI
Fare clic su Assegna.
Per il Progetto, selezionare Data governance.
Fare clic su Assegna.
Una volta assegnati correttamente gli oggetti virtuali, passare al proprio progetto.
Nel progetto Data governance , fare clic sulla scheda Asset . Le tabelle di dati virtuali iniziano con
<your schema>
.Aprire una delle tabelle di dati virtuali. Ad esempio, fare clic sulla tabella virtuale APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNITO per visualizzarla.
Fornire le proprie credenziali per accedere all'asset di dati.
Per il Metodo di autenticazione, selezionare Chiave API.
Incollate la stessa chiave API creata nell'esercitazione Virtualize external data.
Fai clic su CONNETTI. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guardate il video a 04:09 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella dati virtuale.
Controllare i progressi
La seguente immagine mostra la tabella virtuale con una colonna mascherata nel progetto dalla prospettiva di un utente differente. Ora è possibile arricchire i dati.
Attività 4: arricchire le tabelle di dati virtuali
Per vedere l'anteprima di questo compito, guardate il video a partire da 04:21.
È possibile arricchire gli asset di dati con informazioni che consentono agli utenti di trovare i dati più rapidamente. Gli utenti possono utilizzare gli arricchimenti per decidere se i dati sono appropriati per l'attività a portata di mano, se possono considerare attendibili i dati e come gestire i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni. Seguire questa procedura per arricchire le tabelle di dati virtuali:
Fare clic su Governance dei dati nel percorso di navigazione per tornare al progetto.
Sul Risorse scheda, fare clic Nuova risorsa > Arricchisci le risorse di dati con metadati .
Per il nome, copiare e incollare il seguente testo:
Virtual mortgage data - metadata enrichment
Fare clic su Avanti per continuare.
Fare clic su Seleziona dati dal progetto.
Selezionare Asset dati.
Fare clic sulla casella di controllo accanto ai seguenti asset:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Fare clic su Seleziona.
Fare clic su Avanti per continuare con l'obiettivo di arricchimento.
Selezionare tutti gli obiettivi di arricchimento:
- Dati del profilo
- Assegna termini
- Esegui analisi della qualità di base
Per Categorie, fare clic su Seleziona categorie.
Selezionare solo [ uncategorized] e Banking.
Fare clic su Seleziona.
Per Campionamento, selezionare Di base.
Fare clic su Avanti per continuare con la pianificazione.
Fare clic su Avanti per continuare la revisione.
Fare clic su Crea.
Viene visualizzato l'asset di arricchimento dei metadati, ma il completamento del lavoro potrebbe richiedere diversi minuti. Fare clic sull'icona di aggiornamento " per osservare il cambiamento di stato da In coda a In corso a Terminato. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.
Controllare i progressi
La seguente immagine mostra l'arricchimento dei metadati completato. Ora è possibile esplorare gli asset di dati arricchiti.
Attività 5: visualizzare i risultati dell'arricchimento dei metadati
Per vedere un'anteprima di questo compito, guardate il video a partire da 05:48.
Una volta completata l'esecuzione dell'arricchimento dei Metadati, attieniti alla seguente procedura per visualizzare i dati arricchiti:
Dalla schermata Virtual mortgage data - metadata enrichment , fai clic sulla scheda Columns .
Cercare
mortgage_applicant
.Nell'elenco di Colonne, individuare la colonna EMAIL_ADDRESS per l'asset your-schema.MORTGAGE_APPLICANT .
Fare clic sul menu Overflow ' alla fine della riga EMAIL_ADDRESS di your_schema.MORTGAGE_APPLICANT e scegliere Visualizza dettagli colonna.
Nel pannello laterale della scheda Dettagli , vengono visualizzate informazioni di creazione profili quali: Formato, Distribuzione frequenza, Statistiche.
Nel pannello laterale, fare clic sulla scheda Governance . Questa scheda include le classi di dati e i termini di business che sono stati assegnati automaticamente durante l'arricchimento dei metadati. È inoltre possibile visualizzare i termini di business e le classi di dati suggeriti e assegnarli manualmente.
Esaminare eventuali termini di business o classi di dati suggeriti e assegnarli manualmente. Ad esempio, è possibile visualizzare Indirizzo come termine di business suggerito.
Fare clic su Termini di business suggeriti.
Per Indirizzo, fare clic su Assegna.
Fare clic su Classi dati consigliate.
Per Testo, fare clic su Assegna.
Alla fine della colonna EMAIL_ADDRESS della riga dell'asset your_schema.MORTGAGE_APPLICANT, fare clic sul menu Overflow ' e scegliere Visualizza dettagli sulla qualità dei dati.
Visualizzare il punteggio di qualità dei dati. IBM Knowledge Catalog genera automaticamente un punteggio di qualità dei dati per ogni colonna e asset di dati analizzando ogni valore in ogni record in base alle dimensioni preintegrate.
Fare clic sulla X per chiudere la finestra Qualità dati .
Cercare
credit_score
.Per la colonna CITY dell'asset your_schema.CREDIT_SCORE, fare clic sul menu Overflow ' e scegliere Mark as reviewed.
Fai clic sulla scheda Assets.
Nell'elenco delle risorse, per la risorsa your_schema.MORTGAGE_APPLICANT, fare clic sul menu Overflow ' e scegliere Visualizza dettagli risorsa.
Nel pannello laterale, fare clic sulla scheda Governance per visualizzare qualsiasi termine di business che è stato assegnato automaticamente.
Fare clic sull'icona Aggiungi ' (o sull'icona Modifica ') per assegnare manualmente i termini commerciali.
Cercare
social
. Se non viene visualizzato alcun risultato, assicurarsi che l'elenco a discesa sia impostato su Tutti i termini invece di Termini suggeriti.Selezionare Social Security Number.
Fare clic su Assegna.
Controllare i progressi
La seguente immagine mostra gli asset di dati revisionati e arricchiti. Il passo successivo è quello di pubblicare i dati arricchiti in un catalogo da condividere con la tua organizzazione.
Attività 6: pubblicazione di tabelle virtuali in un catalogo
Per vedere un'anteprima di questo compito, guardate il video a partire da 7:18.
Ora che i dati virtualizzati sono arricchiti con termini di business, seguire questa procedura per pubblicare le relative tabelle virtuali in un catalogo:
Fare clic su Governance dei dati nel percorso di navigazione per tornare al progetto.
Fai clic sulla scheda Assets.
Passare a Dati> Asset dati.
Fare clic sulla casella di controllo accanto ai seguenti asset:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Fare clic su Pubblica nel catalogo.
Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.
Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.
Esaminare gli asset e fare clic su Pubblica.
In Mortgage Approval Catalog, cercare
<your-schema>
.Aprire una delle tabelle virtuali. Se richiesto, fornire le proprie credenziali:
Per il Metodo di autenticazione, selezionare Chiave API.
Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data .
Fare clic sulla scheda Asset per visualizzare i dati. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guardate il video a 08:17 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella dati virtuale nel catalogo.
Controllare i progressi
La seguente immagine mostra l'anteprima dei dati della tabella virtuale nel catalogo dalla prospettiva dell'utente.
Come data engineer e data steward presso Golden Bank, hai arricchito i dati virtualizzati per garantire che i dati virtualizzati siano protetti.
Ripulitura (facoltativo)
Se si desidera riprendere le esercitazioni nel caso di utilizzo di Data Governance, fare riferimento alla sezione Cleanup in ciascuna delle esercitazioni prerequisite:
Passi successivi
Prova queste esercitazioni:
Registrati per un altro caso di utilizzo di Data fabric.
Ulteriori informazioni
Argomento principale: Esercitazioni del caso d'uso