0 / 0
Torna alla versione inglese della documentazione
Esercitazione di governance dei dati: cura dei dati di alta qualità
Ultimo aggiornamento: 28 nov 2024
Esercitazione di governance dei dati: cura dei dati di alta qualità

Utilizza questa esercitazione per scoprire come preparare i dati attendibili con il caso d'uso Data governance della versione di prova di Data Fabric. Il tuo obiettivo è creare asset di dati attendibili arricchendo i tuoi dati ed eseguendo l'analisi della qualità dei dati.

Avvio rapido: se non è stato ancora creato il progetto di esempio per questa esercitazione, accedere a Progetto di esempio di governance dati nell'hub di risorse.

La storia del tutorial è che Golden Bank ha diversi dipartimenti che hanno bisogno di accedere a dati di alta qualità sui mutui dei clienti. In qualità di Data Steward del team di governance, è necessario ordinare e organizzare i dati dell'azienda per fornire asset di dati di alta qualità e protetti che i consumatori di dati possono facilmente trovare in un catalogo self-service.

La seguente immagine animata fornisce una rapida anteprima di ciò che realizzerai entro la fine di questa esercitazione in cui importerai i metadati da un'origine dati esterna, arricchirai quei dati con termini di business assegnati automaticamente, visualizzerai i dati arricchiti e pubblicherai i dati arricchiti in un catalogo. Fare clic sull'immagine per visualizzare un'immagine più grande.

Immagine animata

Anteprima dell'esercitazione

In questa esercitazione, verranno completate le seguenti attività:

Guarda il video Guarda questo video per visualizzare un'anteprima dei passi in questa esercitazione. Potrebbero esserci lievi differenze nell'interfaccia utente mostrata nel video. Il video è destinato ad essere un compagno del tutorial scritto.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.





Suggerimenti per completare questa esercitazione
Di seguito sono riportati alcuni suggerimenti per completare correttamente questa esercitazione.

Utilizzare il video immagine - in - immagine

Suggerimento: avviare il video, quindi, scorrendo l'esercitazione, il video passa alla modalità immagine - in - immagine. Chiudere il sommario video per la migliore esperienza con l'immagine in foto. È possibile utilizzare la modalità immagine - in - immagine in modo da poter seguire il video mentre si completano le attività in questa esercitazione. Fare clic sulle date / ore per ciascuna attività da seguire.

La seguente immagine animata mostra come utilizzare le funzioni di immagine video e indice:

Come usare il picture-in-picture e i capitoli

Ottieni aiuto nella community

Se si ha bisogno di aiuto con questa esercitazione, è possibile porre una domanda o trovare una risposta nella sezione 'Cloud Pak for Data Forum di discussione della comunità.

Configurare le finestre del browser

Per un'esperienza ottimale durante il completamento di questa esercitazione, apri Cloud Pak for Data in una finestra del browser e tieni aperta questa pagina dell'esercitazione in un'altra finestra del browser per passare facilmente tra le due applicazioni. Prendi in considerazione la possibilità di organizzare le due finestre del browser fianco a fianco per renderle più semplici da seguire.

Esercitazione e IU affiancati

Suggerimento: se si incontra un tour guidato mentre si completa questa esercitazione nell'interfaccia utente, fare clic su Forse in seguito.



Imposta i requisiti

Registrati per Cloud Pak for Data as a Service

Devi registrarti per Cloud Pak for Data as a Service e fornire i servizi necessari per il caso di utilizzo dell'integrazione dei dati.

  • Se hai un account Cloud Pak for Data as a Service esistente, puoi iniziare con questa esercitazione. Se hai un account del piano Lite, solo un utente per account può eseguire questa esercitazione.
  • Se non hai ancora un account Cloud Pak for Data as a Service , registrati per una versione di prova di data fabric.

Icona Video Guardate il seguente video per conoscere il data fabric in Cloud Pak for Data.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.

Verificare i servizi di cui è stato eseguito il provisioning necessari

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 01:05.

Attenersi alla seguente procedura per verificare o eseguire il provisioning dei servizi necessari:

  1. Dal menu di navigazione 'Menu di navigazione, scegliere Servizi > Istanze di servizio.

  2. Utilizzare l'elenco a discesa Prodotto per stabilire se esiste un'istanza del servizio IBM Knowledge Catalog .

  3. Se è necessario creare un'istanza del servizio IBM Knowledge Catalog , fare clic su Aggiungi servizio.

    1. Selezionare IBM Knowledge Catalog.

    2. Seleziona il piano Lite.

    3. Fare clic su Crea.

  4. Ripeti questi passi per verificare o eseguire il provisioning del servizio Cloud Object Storage .

Icona Checkpoint Controllare i progressi

La seguente immagine mostra le istanze del servizio di cui è stato eseguito il provisioning:

Servizi con provisioning

Crea il progetto di esempio

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 01:38.

Se non hai già creato il progetto di esempio per questa esercitazione, segui questi passi:

  1. Accedere al progetto campione di governance dei dati nell'hub Risorse.

  2. Fare clic su Crea progetto.

  3. Se ti viene richiesto di associare il progetto a un'istanza Cloud Object Storage , seleziona un'istanza Cloud Object Storage dall'elenco.

  4. Fare clic su Crea.

  5. Attendere il completamento dell'importazione del progetto, quindi fare clic su Visualizza nuovo progetto per verificare che il progetto e gli asset siano stati creati correttamente.

  6. Fare clic sulla scheda Asset per visualizzare gli asset del progetto.

  7. Dal menu Overflow 'Menu di overflow alla fine della riga dell'asset dati Banking.csv, scegliere Download e salvarlo sul computer. Il file verrà utilizzato in un secondo momento.

Nota: potresti visualizzare un tour guidato che mostra le esercitazioni incluse con questo caso di utilizzo. I link nel tour guidato apriranno queste istruzioni dell'esercitazione.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la scheda Asset del progetto di esempio. È ora possibile avviare l'esercitazione.

Progetto di esempio




Attività 1: creare un catalogo

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 02:49.

Prima di iniziare a utilizzare i dati, creare un catalogo in cui pubblicare i dati per condividerli con la propria organizzazione. Con il piano IBM Knowledge Catalog Lite, è possibile creare solo due cataloghi. Se si dispone già di un catalogo, è possibile ignorare questo passaggio. Altrimenti, attenersi alla seguente procedura per creare un catalogo:

Suggerimento: se questa è la prima volta che si accede a un catalogo, viene visualizzato un tour guidato che chiede se si desidera visualizzare i cataloghi. Per ora, fare clic su Forse in seguito.
  1. Dal menu di navigazione 'Menu di navigazione, scegliere Cataloghi > Visualizza tutti i cataloghi.

  2. Se viene visualizzato un catalogo nella pagina Cataloghi , passare a Attività 2: creare una categoria. Altrimenti, attenersi alla seguente procedura per creare un nuovo catalogo:

  3. Fare clic su Crea catalogo.

  4. Per il Nome, copiare e incollare il nome del catalogo esattamente come mostrato senza spazi iniziali o finali:

    Mortgage Approval Catalog
    
  5. Selezionare Applica regole di protezione dati, confermare la selezione e accettare i valori predefiniti per gli altri campi.

  6. Fare clic su Crea.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra il tuo catalogo. Si è ora pronti a condividere gli asset con la propria organizzazione.

Catalogo approvazione mutuo




Attività 2: creare una categoria

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 03:13.

È necessaria una categoria per contenere i termini di business che saranno importati nella prossima attività. Le categorie agiscono come cartelle per organizzare le risorse utente di governance e le persone che possono creare e gestire tali risorse utente. Seguire questa procedura per creare una categoria:

  1. Dal menu di navigazione di Cloud Pak for Data 'Menu di navigazione, scegliere Governance > Categorie.

  2. Fare clic su Aggiungi categoria> Nuova categoria.

  3. Per il nome, immettere Banking.

  4. Fare clic su Crea.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra la categoria Banking. È ora possibile importare termini di business.

Categoria bancaria




Attività 3: aggiunta dei termini di business

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 03:41.

Ora importare i termini di business nella nuova categoria. Li userai per arricchire i tuoi asset di dati in un passo successivo. I termini di business sono definizioni standardizzate di concetti di business in modo che i dati vengano descritti in modo uniforme e facilmente comprensibile all'interno dell'azienda. Attenersi alla seguente procedura per importare i termini di business da un file:

  1. Dal menu di navigazione di Cloud Pak for Data 'Menu di navigazione, scegliere Governance > Termini di business.

  2. Fare clic su Aggiungi termine di business> Importa da file.

  3. Fare clic su Trascina e rilascia il file qui o carica.

    1. Selezionare il file banking.csv scaricato in precedenza.

    2. Fare clic su Apri.

  4. Fare clic su Avanti.

  5. Selezionare Sostituisci tutti i valorie fare clic su Avanti.

  6. Fare clic su Vai all'attività per visualizzare la bozza dei termini di business. Se si perde la notifica, dal menu di navigazione di Cloud Pak for Data 'Menu di navigazione, scegliere Governance > Posta in arrivo.

  7. Selezionare la casella di spunta Pubblica termini di business , quindi fare clic su Pubblica. Fare clic su Pubblica per confermare.

  8. Dal menu di navigazione di Cloud Pak for Data 'Menu di navigazione, scegliere Governance > Business terms per visualizzare i business terms pubblicati.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra i termini di business importati. È ora possibile importare i dati in un progetto e quindi arricchire con i termini di business importati.

Termini di business importati




Attività 4: importazione di dati in un progetto

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire da 04:47.

Il progetto di esempio include una connessione a un'istanza Db2 Warehouse , che contiene gli asset del mutuo. È possibile importare i metadati tecnici associati agli asset di dati in un progetto o in un catalogo per inventariare, valutare e catalogare tali asset. I metadati tecnici descrivono la struttura degli oggetti dati. Attenersi alla seguente procedura per importare gli asset di dati:

  1. Dal menu di navigazione 'Menu di navigazione, scegliere Progetti > Visualizza tutti i progetti.

  2. Fare clic sul progetto Data governance .

  3. Fai clic sulla scheda Assets.

  4. Clic Nuova risorsa > Importa metadati per risorse dati .

  5. Per il nome, copiare e incollare il seguente testo:

    Mortgage data - metadata import
    
  6. Fare clic su Avanti per continuare.

  7. Nella pagina Seleziona destinazione , selezionare Questo progettoe fare clic su Avanti per continuare.

  8. Nella pagina Seleziona ambito , fare clic su Seleziona connessione.

    1. Selezionare la connessione Data Fabric di prova - Db2 Warehouse .

    2. Selezionare la casella di spunta accanto allo schema WKC_MORTGAGE , quindi fare clic sul nome dello schema WKC_MORTGAGE .

    3. Selezionare le seguenti tabelle:

      • CLIENT_COMMERCIALE
      • PUNTO_CREDITO
      • PREZZO_CASA
      • ASPIRANTI ipotecari
      • APPLICAZIONE_MUTUO
    4. Rivedere l'elenco di asset nel pannello laterale e fare clic su Seleziona.

  9. Fare clic su Avanti per continuare con la pianificazione. Puoi eseguire manualmente l'arricchimento dei metadati, in modo da mantenere la pianificazione disattivata.

  10. Fare clic su Avanti per passare a Opzioni avanzate.

  11. Accettare i valori predefiniti per la pagina Opzioni avanzate e fare clic su Avanti per continuare la revisione.

  12. Esaminare il riepilogo dell'importazione e fare clic su Crea. Il lavoro di importazione metadati viene avviato.

  13. Fare clic sull'icona di aggiornamento " Aggiornamento per osservare il cambiamento di stato da In coda a In corso a Importato. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra l'importazione di metadati completata. L'attività successiva consiste nell'arricchire gli asset di dati importati con i termini di business importati.

Metadata import asset




Attività 5: arricchire i dati importati

video dell'esercitazione di anteprima Per vedere un'anteprima di questo compito, guardate il video a partire dal minuto 06:07.

È possibile arricchire gli asset di dati con informazioni che consentono agli utenti di trovare i dati più rapidamente per decidere se i dati sono appropriati per l'attività in corso, se possono fidarsi dei dati e come utilizzare i dati. Tali informazioni includono, ad esempio, i termini che definiscono il significato dei dati, le regole che documentano la proprietà o determinano gli standard di qualità o le revisioni. Seguire questa procedura per arricchire i dati importati:

  1. Fate clic sul nome del progetto di governance dei dati nel percorso di navigazione.
    Traccia di navigazione

  2. Sul Risorse scheda, fare clic Nuova risorsa > Arricchisci le risorse di dati con metadati .

  3. Per il nome, copiare e incollare il seguente testo:

    Mortgage data - metadata enrichment
    
  4. Fare clic su Avanti per continuare.

  5. Fare clic su Seleziona dati dal progetto.

    1. Selezionare Metadata import.

    2. Fare clic sulla casella di controllo accanto a Dati ipotecari - importazione metadati. Questo asset include i seguenti asset:

      • CLIENT_COMMERCIALE
      • PUNTO_CREDITO
      • PREZZO_CASA
      • ASPIRANTI ipotecari
      • APPLICAZIONE_MUTUO
    3. Fare clic su Seleziona.

  6. Fare clic su Avanti per continuare con l'obiettivo di arricchimento.

  7. Selezionare tutti gli obiettivi di arricchimento:

    • Dati del profilo
    • Assegna termini
    • Esegui analisi della qualità di base
  8. Per Categorie, fare clic su Seleziona categorie.

    1. Selezionare solo [ uncategorized] e Banking.

    2. Fare clic su Seleziona.

  9. Per Campionamento, selezionare Di base.

  10. Fare clic su Avanti per continuare con la pianificazione. È possibile eseguire manualmente l'importazione, in modo da mantenere la pianificazione disattivata.

  11. Fare clic su Avanti per continuare la revisione.

  12. Fare clic su Crea.

  13. Viene visualizzato l'asset di arricchimento dei metadati, ma il completamento del lavoro potrebbe richiedere diversi minuti. Fare clic sull'icona di aggiornamento 'Aggiornamento per osservare il cambiamento di stato da Non analizzato a In corso a Terminato. Una volta completata l'esecuzione del lavoro, vengono visualizzati i cinque asset elencati.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra l'arricchimento dei metadati completato. Ora è possibile esplorare gli asset di dati arricchiti.

Asset di arricchimento metadati




Attività 6: visualizzazione dei risultati dell'arricchimento dei metadati

video dell'esercitazione di anteprima Per avere un'anteprima di questo compito, guardate il video a partire da 07:45.

Una volta completata l'esecuzione dell'arricchimento dei Metadati, attieniti alla seguente procedura per visualizzare i dati arricchiti:

  1. Dalla schermata Dati ipotecari - Arricchimento metadati , fai clic sulla scheda Colonne .

  2. Nell'elenco di Colonne, individuare la colonna EMAIL_ADDRESS per l'asset MORTGAGE .

    1. Alla fine della riga EMAIL_ADDRESS for MORTGAGE_APPLICANTS, fare clic sul menu Overflow 'Menu di overflow e scegliere Visualizza dettagli colonna.

    2. Nel pannello laterale della scheda Dettagli , vengono visualizzate informazioni di creazione profili quali: Formato, Distribuzione frequenza, Statistiche.

    3. Nel pannello laterale, fare clic sulla scheda Governance . Questa scheda include le classi di dati e i termini di business che sono stati assegnati automaticamente durante l'arricchimento dei metadati. È inoltre possibile visualizzare i termini di business e le classi di dati suggeriti e assegnarli manualmente.

    4. Esaminare eventuali termini di business o classi di dati suggeriti e assegnarli manualmente. Ad esempio, è possibile visualizzare Indirizzo come termine di business suggerito.

      1. Fare clic su Termini di business suggeriti.

      2. Per Indirizzo, fare clic su Assegna.

  3. Alla fine della colonna EMAIL_ADDRESS per la riga dell'asset MORTGAGE_APPLICANTS, fare clic sul menu Overflow 'Menu di overflow e scegliere Visualizza dettagli sulla qualità dei dati.

    1. Visualizzare le informazioni sulla qualità dei dati. IBM Knowledge Catalog genera automaticamente un punteggio di qualità dei dati per ogni colonna e asset di dati analizzando ogni valore in ogni record in base alle dimensioni preintegrate.

    2. Fare clic sulla X per chiudere la finestra Qualità dati .

  4. Per la colonna CITY dell'asset CREDIT_SCORE, fare clic sul menu Overflow 'Menu di overflow e scegliere Mark as reviewed.

  5. Fai clic sulla scheda Assets.

  6. Nell'elenco delle attività, per l'attività MORTGAGE_APPLICANTS, fare clic sul menu Overflow 'Menu di overflow e scegliere Visualizza dettagli attività.

    1. Nel pannello laterale, fare clic sulla scheda Governance per visualizzare l'assegnazione automatica del termine di business.

    2. Fare clic sull'icona Modifica 'Modifica per assegnare manualmente i termini commerciali.

    3. Cercare social. Se non viene visualizzato alcun risultato, assicurarsi che l'elenco a discesa sia impostato su Tutti i termini invece di Termini suggeriti.

    4. Selezionare Social Security Number.

    5. Fare clic su Assegna.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra gli asset di dati revisionati e arricchiti. Il passo successivo è quello di pubblicare i dati arricchiti in un catalogo da condividere con la tua organizzazione.

Asset di dati arricchiti revisionati




Attività 7: pubblicazione dei dati in un catalogo

video dell'esercitazione di anteprima Per vedere l'anteprima di questo compito, guardate il video a partire da 09:06.

Ora che i dati sono stati arricchiti, si desidera pubblicare tali asset di dati in un catalogo in modo che i data scientist e gli analisti di dati possano utilizzare gli asset di dati arricchiti. Seguire questa procedura per memorizzare gli asset di dati arricchiti in un catalogo per consentire ad altri di accedere ai dati attendibili:

  1. Fare clic sul nome del progetto Data governance nella traccia di navigazione.

  2. Fai clic sulla scheda Assets.

  3. Selezionare Dati> Asset dati.

  4. Selezionare gli asset di dati COMMERICIAL_CLIENT, HOUSE_PRICE, MORTGAGEe MORTGAGE age_application dall'elenco e fare clic su Pubblica nel catalogo.

    1. Per il catalogo Destinazione , selezionare Catalogo approvazione mutuoe fare clic su Avanti.

    2. Per Tag, immettere la tag, trusted, e fare clic su + (segno più), quindi fare clic su Avanti.

    3. Esaminare gli asset e fare clic su Pubblica.

  5. Deselezionare tutti gli asset selezionati, quindi selezionare la casella di controllo accanto all'asset CREDIT_SCORE dall'elenco e fare clic su Pubblica nel catalogo.

    1. Per il catalogo Destinazione , selezionare Catalogo approvazione mutuoe fare clic su Avanti.

    2. Per Tag, immettere il tag confidentiale fare clic su + (segno più).

    3. Immettere il tag trustede fare clic su + (segno più) in un secondo tag.

    4. Selezionare l'opzione Vai al catalogo dopo averlo pubblicatoe fare clic su Avanti.

    5. Esaminare gli asset e fare clic su Pubblica.

  6. Filtrare gli asset nel Catalogo approvazione mutuo.

    1. Fare clic sull'icona del filtro 'Filtro.

    2. Espandere la sezione Tag .

    3. Selezionare trustede fare clic su Applica.

    4. Verificare che le cinque risorse di dati siano stati aggiunti al catalogo.

  7. Modificare il nome dell'asset di dati MORTGAGE .

    1. Aprire l'asset IPOTECAGE_RICHIEDENTI .

    2. Fare clic sull'icona Modifica nome 'Modifica nome.

    3. Modificare il nome in:

      MORTGAGE_APPLICANTS_TRUST
      
    4. Fai clic su Applica.

Icona Checkpoint Controllare i progressi

La seguente immagine mostra gli asset di dati arricchiti pubblicati in un catalogo. Ora sono disponibili dati attendibili tramite il catalogo della propria azienda.

Asset pubblicati nel catalogo



In qualità di Data Steward del team di governance, si è appreso come ordinare e organizzare i dati aziendali per fornire asset di dati protetti e di alta qualità che i consumatori di dati possono facilmente trovare in un catalogo self - service.

Passi successivi

Ora è possibile proteggere i dati creando regole di protezione dati e mascherando i flussi per controllare l'accesso ai dati. Vedi l'esercitazione Proteggi i tuoi dati .

Ulteriori informazioni

Argomento principale: Esercitazioni del caso d'uso

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni