0 / 0
Torna alla versione inglese della documentazione
Esercitazione sulla governance dei dati: gestione dei dati virtualizzati

Esercitazione sulla governance dei dati: gestione dei dati virtualizzati

Questa Eseguire questa esercitazione per gestire i dati virtualizzati dopo aver completato l'esercitazione Curate high quality data, Protect your data tutoriale Virtualize external data tutorial con il caso d'uso Data integration della versione di prova di data fabric. Il tuo obiettivo è proteggere i dati virtuali che contengono i richiedenti e le domande di mutuo e i loro punteggi di credito per l'accesso non autorizzato. Alcune informazioni personali, come il numero di previdenza sociale, devono essere mascherate in modo che tutti i dipendenti di Golden Bank non abbiano accesso a tali informazioni personali.

Avvio rapido: se non è stato ancora creato il progetto di esempio per questa esercitazione, accedere a Progetto di esempio di governance dati nell'hub di risorse.

La storia dell'esercitazione è che Golden Bank ha diversi reparti che devono accedere a dati ipotecari dei clienti di alta qualità memorizzati in tre origini dati esterne. In qualità di Data Steward del team di governance, è necessario arricchire i dati virtualizzati e assicurarsi che i dati virtualizzati siano protetti.

La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Aggiungerai dati virtuali al progetto, quindi arricchirai tali dati con termini di business e vedrai come le regole di protezione dei dati di IBM Knowledge Catalog mascherano i dati tramite Cloud Pak for Data as a Service. Fare clic sull'immagine per visualizzare un'immagine più grande.

Immagine animata

Anteprima dell'esercitazione

In questa esercitazione, verranno completate le seguenti attività:

Guarda il video Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.





Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se hai bisogno di aiuto con questa esercitazione, puoi fare una domanda o trovare una risposta nel forum di discussione della comunitàCloud Pak for Data.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Imposta i requisiti

Completare le esercitazioni prerequisite

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 00:27.

Completare le seguenti esercitazioni:




Attività 1: abilitare la governance dei dati virtualizzati

Sono necessari due passi per abilitare la governance dei dati virtualizzati:

  • Applica regole di protezione dati in Watson Query.
  • Configurare l'autorizzazione tra IBM Knowledge Catalog e Watson Query.

Applica regole di protezione dei dati

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 01:02.

Seguire questa procedura per applicare le regole di protezione dei dati in Watson Query:

  1. Nel Menu di navigazione Menu di navigazione, scegliere Dati > Data virtualization.

  2. Se viene visualizzata una notifica a Impostare un catalogo primario per applicare la governance, fare clic su Vai a Governance. Se questo messaggio non viene visualizzato, dal menu del servizio, fare clic su Amministrazione> Impostazioni servizio, quindi fare clic sulla scheda Governance .
    Menu Watson Query Service

  3. Abilitare l'opzione Applica regole di protezione dei dati per gli oggetti virtuali e fare clic su Salva.

  4. Dal menu del servizio, ritorna a Virtualizzazione> Origini dati.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la scheda Governance con l'applicazione della politica abilitata. Successivamente, è necessario configurare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.

Applica politiche

Configura autorizzazione tra IBM Knowledge Catalog e Watson Query

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 01:00.

Segui questi passi per configurare l'autorizzazione tra IBM Knowledge Catalog e Watson Query:

  1. Visita la pagina Autorizzazioni nella console IBM Cloud .

  2. Fare clic su Crea.

  3. Per In quale account è il servizio? selezionare Questo account.

  4. Per il servizio Quali servizi hanno bisogno di accesso? selezionare IBM Knowledge Catalog.

  5. Per Come si desidera definire l'ambito dell'accesso? in IBM Knowledge Catalog, selezionare Tutte le risorse.

  6. Per A cosa si desidera fornire l'accesso origine? selezionare Watson Query.

  7. Per Come si desidera definire l'ambito dell'accesso? per Watson Query, selezionare Tutte le risorse.

  8. Per Accesso al servizio, selezionare DataAccess (Solo per autorizzazione servizio - servizio).

  9. Fai clic su Authorize.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la pagina Autorizzazioni in IBM Cloud con l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization. Ora è possibile interrogare le tabelle virtuali governate in Data Virtualization.

Pagina Autorizzazioni




Attività 2: esecuzione di una query SQL sulle tabelle virtuali gestite

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 02:00.

Con le regole di protezione dei dati in vigore, le tabelle virtuali sono regolate da tali regole. Attenersi alla seguente procedura per eseguire una query SQL su una tabella virtuale gestita:

  1. Dal menu del servizio Watson Query , fare clic su Esegui SQL
    Menu Watson Query Service

  2. Copiare e incollare la seguente istruzione SELECT per la nuova interrogazione. Sostituisci <your schema> con il nome schema che hai notato in precedenza.

    SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    

    La query è simile a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    Istruzione Select

  3. Fare clic su Esegui tutto.

  4. Una volta completata la query, selezionare la query nella scheda Cronologia . Nella scheda Risultati , è possibile vedere che la tabella è filtrata solo per gli aspiranti dello stato della California. Le regole di protezione dei dati si applicano in Watson Query, anteprima del catalogo, download del catalogo, Data Refinerye anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guarda il video all'indirizzo 02:47 per vedere cosa vedono gli altri utenti quando eseguono la query SQL.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra i risultati della query SQL dalla prospettiva di un altro utente. Ora si è pronti a copiare le tabelle virtuali nel progetto.

Risultati della query SQL




Attività 3: copiare i dati virtuali nel progetto

video dell'esercitazione di anteprima Per visualizzare in anteprima questa attività, guardare il video a partire dalle 03:02.

Nell'esercitazione Virtualizza dati esterni , sono state create tabelle virtuali e viste di unione virtuali e copiate nel progetto di integrazione dati. Se si desidera utilizzare tale progetto per completare questa esercitazione, passare all' Attività 3. Se si desidera utilizzare il progetto di governance dei dati per completare questa esercitazione, attenersi alla seguente procedura:

  1. Dal menu del servizio, fare clic su Virtualizzazione> Dati virtualizzati
    Menu Watson Query Service

  2. Selezionare le seguenti tabelle:

    • APPLICAZIONE_MUTUO
    • IPOTECA_ASPIRANTE
    • PUNTO_CREDITO
    • APPLICANTI_APPLICAZIONI_UNITI
    • APPLICANTI_APPLICATIONS_CREDIT_SCORE_UNITI
  3. Fare clic su Assegna.

  4. Per il Progetto, selezionare Data governance.

  5. Fare clic su Assegna.

  6. Una volta assegnati correttamente gli oggetti virtuali, passare al proprio progetto.

  7. Nel progetto Data governance , fare clic sulla scheda Asset . Le tabelle di dati virtuali iniziano con <your schema>.

  8. Aprire una delle tabelle di dati virtuali. Ad esempio, fare clic sulla tabella virtuale APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNITO per visualizzarla.

  9. Fornire le proprie credenziali per accedere all'asset di dati.

    1. Per il Metodo di autenticazione, selezionare Chiave API.

    2. Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data . Incolla chiave API

    3. Fai clic su CONNETTI. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guarda il video su 04:09 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella di dati virtuali.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra la tabella virtuale con una colonna mascherata nel progetto dalla prospettiva di un utente differente. Ora è possibile arricchire i dati.

Tabella virtuale nel progetto




Attività 4: arricchire le tabelle di dati virtuali

video dell'esercitazione di anteprima Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 04:00.

È possibile arricchire gli asset di dati con informazioni che consentono agli utenti di trovare i dati più rapidamente. Gli utenti possono utilizzare gli arricchimenti per decidere se i dati sono appropriati per l'attività a portata di mano, se possono considerare attendibili i dati e come gestire i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni. Seguire questa procedura per arricchire le tabelle di dati virtuali:

  1. Fare clic su Data governance nella traccia di navigazione per tornare al progetto
    Traccia di navigazione

  2. Sul Risorse scheda, fare clic Nuova risorsa > Arricchisci le risorse di dati con metadati .

  3. Per il nome, copiare e incollare il seguente testo:

    Virtual mortgage data - metadata enrichment
    
  4. Fare clic su Avanti per continuare.

  5. Fare clic su Seleziona dati dal progetto.

    1. Selezionare Asset dati.

    2. Fare clic sulla casella di controllo accanto ai seguenti asset:

      • <your schema>.MORTGAGE_APPLICATION
      • <your schema>.MORTGAGE_APPLICANT
      • <your schema>.CREDIT_SCORE
      • <your schema>.APPLICANTS_APPLICATIONS_JOINED
      • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
    3. Fare clic su Seleziona.

  6. Fare clic su Avanti per continuare con l'obiettivo di arricchimento.

  7. Selezionare tutti gli obiettivi di arricchimento:

    • Dati del profilo
    • Assegna termini
    • Esegui analisi della qualità di base
  8. Per Categorie, fare clic su Seleziona categorie.

    1. Selezionare solo [ uncategorized] e Banking.

    2. Fare clic su Seleziona.

  9. Per Campionamento, selezionare Di base.

  10. Fare clic su Avanti per continuare con la pianificazione.

  11. Fare clic su Avanti per continuare la revisione.

  12. Fare clic su Crea.

  13. Viene visualizzato l'asset di arricchimento dei metadati, ma il completamento del lavoro potrebbe richiedere diversi minuti. Fare clic sull'icona Aggiorna Aggiorna per visualizzare la modifica di stato da In coda a In corso a Terminata. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra l'arricchimento dei metadati completato. Ora è possibile esplorare gli asset di dati arricchiti.

Dati arricchiti




Attività 5: visualizzare i risultati dell'arricchimento dei metadati

video dell'esercitazione di anteprima Per visualizzare un'anteprima di questa attività, guardare il video a partire dalle 05:00.

Una volta completata l'esecuzione dell'arricchimento dei Metadati, attieniti alla seguente procedura per visualizzare i dati arricchiti:

  1. Dalla schermata Virtual mortgage data - metadata enrichment , fai clic sulla scheda Columns .

  2. Cercare mortgage_applicant.

  3. Nell'elenco di Colonne, individuare la colonna EMAIL_ADDRESS per l'asset your-schema.MORTGAGE_APPLICANT .

    1. Fai clic sul menu Overflow Menu di overflow alla fine di EMAIL_ADDRESS per la tua riga your_schema.MORTGAGE_APPLICANT e scegli View column details.

    2. Nel pannello laterale della scheda Dettagli , vengono visualizzate informazioni di creazione profili quali: Formato, Distribuzione frequenza, Statistiche.

    3. Nel pannello laterale, fare clic sulla scheda Governance . Questa scheda include le classi di dati e i termini di business che sono stati assegnati automaticamente durante l'arricchimento dei metadati. È inoltre possibile visualizzare i termini di business e le classi di dati suggeriti e assegnarli manualmente.

    4. Esaminare eventuali termini di business o classi di dati suggeriti e assegnarli manualmente. Ad esempio, è possibile visualizzare Indirizzo come termine di business suggerito.

      1. Fare clic su Termini di business suggeriti.

      2. Per Indirizzo, fare clic su Assegna.

      3. Fare clic su Classi dati consigliate.

      4. Per Testo, fare clic su Assegna.

  4. Alla fine della colonna EMAIL_ADDRESS per la tua riga dell'asset your_schema.MORTGAGE_APPLICANT , fai clic sul menu Overflow Menu di overflowe scegli View data quality details.

    1. Visualizzare il punteggio di qualità dei dati. IBM Knowledge Catalog genera automaticamente un punteggio di qualità dei dati per ogni colonna e asset di dati analizzando ogni valore in ogni record in base alle dimensioni preintegrate.

    2. Fare clic sulla X per chiudere la finestra Qualità dati .

  5. Cercare credit_score.

  6. Per la colonna CITY per l'asset your_schema.CREDIT_SCORE , fare clic sul menu Overflow Menu di overflowe scegliere Contrassegna come revisionato.

  7. Fai clic sulla scheda Assets.

  8. Nell'elenco di Asset, per il proprio asset your_schema.MORTGAGE_APPLICANT , fare clic sul menu Overflow Menu di overflowe scegliere Visualizza dettagli asset.

    1. Nel pannello laterale, fare clic sulla scheda Governance per visualizzare qualsiasi termine di business che è stato assegnato automaticamente.

    2. Fare clic sull'icona Aggiungi Aggiungi (oppure potrebbe essere visualizzata l'icona Modifica Modifica) per assegnare manualmente i termini di business.

    3. Cercare social. Se non viene visualizzato alcun risultato, assicurarsi che l'elenco a discesa sia impostato su Tutti i termini invece di Termini suggeriti.

    4. Selezionare Social Security Number.

    5. Fare clic su Assegna.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra gli asset di dati revisionati e arricchiti. Il passo successivo è quello di pubblicare i dati arricchiti in un catalogo da condividere con la tua organizzazione.

Asset di dati arricchiti revisionati




Attività 6: pubblicazione di tabelle virtuali in un catalogo

video dell'esercitazione di anteprima Per visualizzare l'anteprima di questa attività, guardare il video a partire dalle 7:18.

Ora che i dati virtualizzati sono arricchiti con termini di business, seguire questa procedura per pubblicare le relative tabelle virtuali in un catalogo:

  1. Fare clic su Data governance nella traccia di navigazione per tornare al progetto.
    Traccia di navigazione

  2. Fai clic sulla scheda Assets.

  3. Passare a Dati> Asset dati.

  4. Fare clic sulla casella di controllo accanto ai seguenti asset:

    • <your schema>.MORTGAGE_APPLICATION
    • <your schema>.MORTGAGE_APPLICANT
    • <your schema>.CREDIT_SCORE
    • <your schema>.APPLICANTS_APPLICATIONS_JOINED
    • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
  5. Fare clic su Pubblica nel catalogo.

    1. Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.

    2. Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.

    3. Esaminare gli asset e fare clic su Pubblica.

  6. In Mortgage Approval Catalog, cercare <your-schema>.

  7. Aprire una delle tabelle virtuali. Se richiesto, fornire le proprie credenziali:

    1. Per il Metodo di autenticazione, selezionare Chiave API.

    2. Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data .

  8. Fare clic sulla scheda Asset per visualizzare i dati. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guarda il video alle 08:17 per vedere cosa vedono gli altri utenti che tentano di accedere alla tabella di dati virtuali nel catalogo.

Icona Checkpoint Controlla i tuoi progressi

La seguente immagine mostra l'anteprima dei dati della tabella virtuale nel catalogo dalla prospettiva dell'utente.

Anteprima catalogo



Come data engineer e data steward presso Golden Bank, hai arricchito i dati virtualizzati per garantire che i dati virtualizzati siano protetti.

Ripulitura (facoltativo)

Se si desidera riprendere le esercitazioni nel caso di utilizzo di Data Governance, fare riferimento alla sezione Cleanup in ciascuna delle esercitazioni prerequisite:


Passi successivi

Ulteriori informazioni

Argomento principale: Esercitazioni del caso d'uso

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni