0 / 0
Torna alla versione inglese della documentazione
Esercitazione sulla governance dei dati: gestione dei dati virtualizzati
Ultimo aggiornamento: 28 nov 2024
Esercitazione sulla governance dei dati: gestione dei dati virtualizzati

Questa esercitazione consente di governare i dati virtualizzati dopo aver completato le esercitazioni Curate i dati di alta qualità, Proteggete i vostri dati e Virtualizzate i dati esterni con il caso d'uso dell'integrazione dei dati della sperimentazione del data fabric. Il tuo obiettivo è proteggere i dati virtuali che contengono i richiedenti e le domande di mutuo e i loro punteggi di credito per l'accesso non autorizzato. Alcune informazioni personali, come il numero di previdenza sociale, devono essere mascherate in modo che tutti i dipendenti di Golden Bank non abbiano accesso a tali informazioni personali.

Avvio rapido: se non è stato ancora creato il progetto di esempio per questa esercitazione, accedere a Progetto di esempio di governance dati nell'hub di risorse.

La storia dell'esercitazione è che Golden Bank ha diversi reparti che devono accedere a dati ipotecari dei clienti di alta qualità memorizzati in tre origini dati esterne. In qualità di Data Steward del team di governance, è necessario arricchire i dati virtualizzati e assicurarsi che i dati virtualizzati siano protetti.

La seguente immagine animata fornisce una rapida anteprima di ciò che si realizzerà entro la fine di questo tutorial. Aggiungerai dati virtuali al progetto, quindi arricchirai tali dati con termini di business e vedrai come le regole di protezione dei dati di IBM Knowledge Catalog mascherano i dati tramite Cloud Pak for Data as a Service. Fare clic sull'immagine per visualizzare un'immagine più grande.

Immagine animata

Anteprima dell'esercitazione

In questa esercitazione, verranno completate le seguenti attività:

Guarda il video Guardate questo video per vedere un'anteprima dei passaggi di questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.





Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se si ha bisogno di aiuto con questa esercitazione, è possibile porre una domanda o trovare una risposta nella sezione 'Cloud Pak for Data Forum di discussione della comunità.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Imposta i requisiti

Completare le esercitazioni prerequisite

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 00:27.

Completare le seguenti esercitazioni:

Base Premium Standard Se non diversamente specificato, queste informazioni si applicano a tutte le edizioni di IBM Knowledge Catalog.




Attività 1: abilitare la governance dei dati virtualizzati

Sono necessari due passi per abilitare la governance dei dati virtualizzati:

  • Applicare le regole di protezione dei dati nella Data Virtualization.
  • Impostare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.

Applica regole di protezione dei dati

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 01:02.

Seguite questi passaggi per applicare le regole di protezione dei dati in Data Virtualization:

  1. Dal menu di navigazione 'Menu di navigazione, scegliere Dati > Data virtualization.

  2. Se viene visualizzata una notifica a Impostare un catalogo primario per applicare la governance, fare clic su Vai a Governance. Se non viene visualizzato questo messaggio, dal menu del servizio, fare clic su Amministrazione > Impostazioni del servizio, quindi fare clic sulla scheda Governance.
    Menu del servizio di Data Virtualization

  3. Abilitare l'opzione Applica regole di protezione dei dati per gli oggetti virtuali e fare clic su Salva.

  4. Dal menu del servizio, ritorna a Virtualizzazione> Origini dati.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la scheda Governance con l'applicazione della politica abilitata. Successivamente, è necessario configurare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization.

Applica politiche

Impostazione dell'autorizzazione tra IBM Knowledge Catalog e Data Virtualization

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 01:40.

Seguite questi passaggi per impostare l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization:

  1. Visitare la pagina Autorizzazioni nella console IBM Cloud.

  2. Fare clic su Crea.

  3. Per In quale account è il servizio? selezionare Questo account.

  4. Per il servizio Quali servizi hanno bisogno di accesso? selezionare IBM Knowledge Catalog.

  5. Per Come si desidera definire l'ambito dell'accesso? in IBM Knowledge Catalog, selezionare Tutte le risorse.

  6. Per A cosa si desidera fornire l'accesso origine? selezionare Data Virtualization.

  7. Per Come si desidera definire l'ambito dell'accesso? in Data Virtualization, selezionare Tutte le risorse.

  8. Per Accesso al servizio, selezionare DataAccess (Solo per autorizzazione servizio - servizio).

  9. Fai clic su Authorize.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la pagina Autorizzazioni in IBM Cloud con l'autorizzazione tra IBM Knowledge Catalog e Data Virtualization. Ora è possibile interrogare le tabelle virtuali governate in Data Virtualization.

Pagina Autorizzazioni




Attività 2: esecuzione di una query SQL sulle tabelle virtuali gestite

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 02:20.

Con le regole di protezione dei dati in vigore, le tabelle virtuali sono regolate da tali regole. Attenersi alla seguente procedura per eseguire una query SQL su una tabella virtuale gestita:

  1. Dal menu del servizio Data Virtualization, fare clic su Esegui SQL.
    'Menu del servizio di Data Virtualization

  2. Copiare e incollare la seguente istruzione SELECT per la nuova interrogazione. Sostituisci <your schema> con il nome schema che hai notato in precedenza.

    SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    

    La vostra query è simile a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    'Istruzione Select

  3. Fare clic su Esegui tutto.

  4. Una volta completata la query, selezionare la query nella scheda Cronologia . Nella scheda Risultati , è possibile vedere che la tabella è filtrata solo per gli aspiranti dello stato della California. Le regole di protezione dei dati si applicano alla Data Virtualization, all'anteprima del catalogo, al download del catalogo, alla Data Refinery e all'anteprima delle risorse del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guardate il video a 02:47 per vedere cosa vedono gli altri utenti quando eseguono la query SQL.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra i risultati della query SQL dalla prospettiva di un altro utente. Ora si è pronti a copiare le tabelle virtuali nel progetto.

Risultati della query SQL




Attività 3: copiare i dati virtuali nel progetto

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 03:02.

Nell'esercitazione Virtualizza dati esterni , sono state create tabelle virtuali e viste di unione virtuali e copiate nel progetto di integrazione dati. Se si desidera utilizzare tale progetto per completare questa esercitazione, passare all' Attività 3. Se si desidera utilizzare il progetto di governance dei dati per completare questa esercitazione, attenersi alla seguente procedura:

  1. Nel menu di servizio, fare clic su Virtualizzazione > Dati virtualizzati.
    Menu del servizio di Data Virtualization

  2. Selezionare le seguenti tabelle:

    • APPLICAZIONE_MUTUO
    • IPOTECA_ASPIRANTE
    • PUNTO_CREDITO
    • APPLICANTI_APPLICAZIONI_UNITI
    • APPLICANTI_APPLICATIONS_CREDIT_SCORE_UNITI
  3. Fare clic su Assegna.

  4. Per il Progetto, selezionare Data governance.

  5. Fare clic su Assegna.

  6. Una volta assegnati correttamente gli oggetti virtuali, passare al proprio progetto.

  7. Nel progetto Data governance , fare clic sulla scheda Asset . Le tabelle di dati virtuali iniziano con <your schema>.

  8. Aprire una delle tabelle di dati virtuali. Ad esempio, fare clic sulla tabella virtuale APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNITO per visualizzarla.

  9. Fornire le proprie credenziali per accedere all'asset di dati.

    1. Per il Metodo di autenticazione, selezionare Chiave API.

    2. Incollate la stessa chiave API creata nell'esercitazione Virtualize external data. Incolla chiave API

    3. Fai clic su CONNETTI. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guardate il video a 04:09 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella dati virtuale.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la tabella virtuale con una colonna mascherata nel progetto dalla prospettiva di un utente differente. Ora è possibile arricchire i dati.

Tabella virtuale nel progetto




Attività 4: arricchire le tabelle di dati virtuali

video dell'esercitazione di anteprima Per vedere l'anteprima di questo compito, guardate il video a partire da 04:21.

È possibile arricchire gli asset di dati con informazioni che consentono agli utenti di trovare i dati più rapidamente. Gli utenti possono utilizzare gli arricchimenti per decidere se i dati sono appropriati per l'attività a portata di mano, se possono considerare attendibili i dati e come gestire i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni. Seguire questa procedura per arricchire le tabelle di dati virtuali:

  1. Fare clic su Governance dei dati nel percorso di navigazione per tornare al progetto.
    Traccia di navigazione

  2. Sul Risorse scheda, fare clic Nuova risorsa > Arricchisci le risorse di dati con metadati .

  3. Per il nome, copiare e incollare il seguente testo:

    Virtual mortgage data - metadata enrichment
    
  4. Fare clic su Avanti per continuare.

  5. Fare clic su Seleziona dati dal progetto.

    1. Selezionare Asset dati.

    2. Fare clic sulla casella di controllo accanto ai seguenti asset:

      • <your schema>.MORTGAGE_APPLICATION
      • <your schema>.MORTGAGE_APPLICANT
      • <your schema>.CREDIT_SCORE
      • <your schema>.APPLICANTS_APPLICATIONS_JOINED
      • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
    3. Fare clic su Seleziona.

  6. Fare clic su Avanti per continuare con l'obiettivo di arricchimento.

  7. Selezionare tutti gli obiettivi di arricchimento:

    • Dati del profilo
    • Assegna termini
    • Esegui analisi della qualità di base
  8. Per Categorie, fare clic su Seleziona categorie.

    1. Selezionare solo [ uncategorized] e Banking.

    2. Fare clic su Seleziona.

  9. Per Campionamento, selezionare Di base.

  10. Fare clic su Avanti per continuare con la pianificazione.

  11. Fare clic su Avanti per continuare la revisione.

  12. Fare clic su Crea.

  13. Viene visualizzato l'asset di arricchimento dei metadati, ma il completamento del lavoro potrebbe richiedere diversi minuti. Fare clic sull'icona di aggiornamento " Aggiornamento per osservare il cambiamento di stato da In coda a In corso a Terminato. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra l'arricchimento dei metadati completato. Ora è possibile esplorare gli asset di dati arricchiti.

Dati arricchiti




Attività 5: visualizzare i risultati dell'arricchimento dei metadati

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 05:48.

Una volta completata l'esecuzione dell'arricchimento dei Metadati, attieniti alla seguente procedura per visualizzare i dati arricchiti:

  1. Dalla schermata Virtual mortgage data - metadata enrichment , fai clic sulla scheda Columns .

  2. Cercare mortgage_applicant.

  3. Nell'elenco di Colonne, individuare la colonna EMAIL_ADDRESS per l'asset your-schema.MORTGAGE_APPLICANT .

    1. Fare clic sul menu Overflow 'Menu di overflow alla fine della riga EMAIL_ADDRESS di your_schema.MORTGAGE_APPLICANT e scegliere Visualizza dettagli colonna.

    2. Nel pannello laterale della scheda Dettagli , vengono visualizzate informazioni di creazione profili quali: Formato, Distribuzione frequenza, Statistiche.

    3. Nel pannello laterale, fare clic sulla scheda Governance . Questa scheda include le classi di dati e i termini di business che sono stati assegnati automaticamente durante l'arricchimento dei metadati. È inoltre possibile visualizzare i termini di business e le classi di dati suggeriti e assegnarli manualmente.

    4. Esaminare eventuali termini di business o classi di dati suggeriti e assegnarli manualmente. Ad esempio, è possibile visualizzare Indirizzo come termine di business suggerito.

      1. Fare clic su Termini di business suggeriti.

      2. Per Indirizzo, fare clic su Assegna.

      3. Fare clic su Classi dati consigliate.

      4. Per Testo, fare clic su Assegna.

  4. Alla fine della colonna EMAIL_ADDRESS della riga dell'asset your_schema.MORTGAGE_APPLICANT, fare clic sul menu Overflow 'Menu di overflow e scegliere Visualizza dettagli sulla qualità dei dati.

    1. Visualizzare il punteggio di qualità dei dati. IBM Knowledge Catalog genera automaticamente un punteggio di qualità dei dati per ogni colonna e asset di dati analizzando ogni valore in ogni record in base alle dimensioni preintegrate.

    2. Fare clic sulla X per chiudere la finestra Qualità dati .

  5. Cercare credit_score.

  6. Per la colonna CITY dell'asset your_schema.CREDIT_SCORE, fare clic sul menu Overflow 'Menu di overflow e scegliere Mark as reviewed.

  7. Fai clic sulla scheda Assets.

  8. Nell'elenco delle risorse, per la risorsa your_schema.MORTGAGE_APPLICANT, fare clic sul menu Overflow 'Menu di overflow e scegliere Visualizza dettagli risorsa.

    1. Nel pannello laterale, fare clic sulla scheda Governance per visualizzare qualsiasi termine di business che è stato assegnato automaticamente.

    2. Fare clic sull'icona Aggiungi 'Aggiungi (o sull'icona Modifica 'Modifica) per assegnare manualmente i termini commerciali.

    3. Cercare social. Se non viene visualizzato alcun risultato, assicurarsi che l'elenco a discesa sia impostato su Tutti i termini invece di Termini suggeriti.

    4. Selezionare Social Security Number.

    5. Fare clic su Assegna.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra gli asset di dati revisionati e arricchiti. Il passo successivo è quello di pubblicare i dati arricchiti in un catalogo da condividere con la tua organizzazione.

Asset di dati arricchiti revisionati




Attività 6: pubblicazione di tabelle virtuali in un catalogo

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 7:18.

Ora che i dati virtualizzati sono arricchiti con termini di business, seguire questa procedura per pubblicare le relative tabelle virtuali in un catalogo:

  1. Fare clic su Governance dei dati nel percorso di navigazione per tornare al progetto.
    Traccia di navigazione

  2. Fai clic sulla scheda Assets.

  3. Passare a Dati> Asset dati.

  4. Fare clic sulla casella di controllo accanto ai seguenti asset:

    • <your schema>.MORTGAGE_APPLICATION
    • <your schema>.MORTGAGE_APPLICANT
    • <your schema>.CREDIT_SCORE
    • <your schema>.APPLICANTS_APPLICATIONS_JOINED
    • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
  5. Fare clic su Pubblica nel catalogo.

    1. Selezionare il Catalogo approvazione mutuo (o il nome del catalogo) dall'elenco e fare clic su Avanti.

    2. Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.

    3. Esaminare gli asset e fare clic su Pubblica.

  6. In Mortgage Approval Catalog, cercare <your-schema>.

  7. Aprire una delle tabelle virtuali. Se richiesto, fornire le proprie credenziali:

    1. Per il Metodo di autenticazione, selezionare Chiave API.

    2. Incolla la stessa chiave API che hai creato nell'esercitazione Virtualize external data .

  8. Fare clic sulla scheda Asset per visualizzare i dati. Le regole di protezione dei dati si applicano nell'anteprima del catalogo, nel download del catalogo, in Data Refinerye nell'anteprima dell'asset del progetto. La regola non si applica al proprietario dell'asset. Guarda il video Guardate il video a 08:17 per vedere cosa vedono gli altri utenti che cercano di accedere alla tabella dati virtuale nel catalogo.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra l'anteprima dei dati della tabella virtuale nel catalogo dalla prospettiva dell'utente.

Anteprima catalogo



Come data engineer e data steward presso Golden Bank, hai arricchito i dati virtualizzati per garantire che i dati virtualizzati siano protetti.

Ripulitura (facoltativo)

Se si desidera riprendere le esercitazioni nel caso di utilizzo di Data Governance, fare riferimento alla sezione Cleanup in ciascuna delle esercitazioni prerequisite:


Passi successivi

Ulteriori informazioni

Argomento principale: Esercitazioni del caso d'uso

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni