0 / 0
Torna alla versione inglese della documentazione
Data governance (IBM Knowledge Catalog)
Ultimo aggiornamento: 13 dic 2024
Data governance (IBM Knowledge Catalog)

La governance dei dati è il processo di monitoraggio e controllo degli asset di dati in base ai metadati degli asset. I cataloghi sono aree di lavoro in cui si fornisce l'accesso controllato agli asset gestiti.

Servizio richiesto
IBM Knowledge Catalog

Un catalogo contiene risorse e collaboratori. I collaboratori sono le persone che aggiungono gli asset nel catalogo e le persone che devono utilizzare gli asset. È possibile modificare la governance dei dati per arricchire e controllare gli asset di dati nei cataloghi.

Scopri di più sulla governance o inizia a utilizzare cataloghi e governance:

Approcci di governance dei dati

È possibile impostare la governance dei dati in maniera iterativa. È possibile iniziare con una semplice implementazione della governance dei dati che si basa su risorse predefinite e funzioni predefinite. Quindi, quando le esigenze cambiano, è possibile personalizzare il framework di governance dei dati per descrivere e proteggere meglio gli asset di dati.

Per visualizzare gli strumenti che possono essere utilizzati per gestire i dati, aprire la mappa di strumenti e servizi e fare clic su Governance nella sezione delle attività.

Implementazione più semplice della governance dei dati

Utilizzare un catalogo per condividere gli asset nella propria organizzazione. Un catalogo può agire come un archivio di funzioni contenendo dataset con colonne utilizzate come funzioni (input) nei modelli di machine learning. Un amministratore di IBM Knowledge Catalog crea il catalogo per condividere gli asset e aggiunge data engineer, data scientist e business analyst come collaboratori. I collaboratori del catalogo possono lavorare con le risorse del catalogo copiandole nei progetti e possono pubblicare le risorse create nei progetti nel catalogo.

I cataloghi memorizzano e tengono traccia delle risorse. I progetti sono quelli in cui gli utenti preparano gli asset di dati e creano modelli. Gli asset si spostano tra il catalogo e i progetti.

I collaboratori del catalogo possono aggiungere gli asset al catalogo da condividere con altri o trovare e utilizzare gli asset nei modi riportati di seguito:

  • Gli ingegneri dei dati creano dati puliti, dati virtualizzati e asset di dati integrati nei progetti e quindi pubblicano gli asset nel catalogo.
  • I data engineer importano tabelle o file da un'origine dati nel catalogo.
  • I data scientist e gli analisti di business trovano gli asset di dati nei cataloghi, quindi aggiungono gli asset ai progetti per gestire i dati.

Gli asset di dati accumulano metadati nel tempo nei seguenti modi:

  • Viene creato il profilo degli asset di dati, che assegna automaticamente classi di dati predefinite che descrivono il formato dei dati.
  • I collaboratori del catalogo aggiungono tag, termini aziendali predefiniti, classi di dati e classificazioni, relazioni e valutazioni agli asset.
  • Tutte le azioni sugli asset vengono automaticamente salvate nello storico asset.

Consultare Creazione di un catalogo.

Opzioni di personalizzazione per la governance dei dati

È possibile aggiungere o aggiornare qualsiasi opzione personalizzata all'implementazione della governance dei dati in qualsiasi momento. Il team di governance può stabilire il vocabolario di business, importare e arricchire i dati con il vocabolario, analizzare la qualità dei dati, definire le regole per proteggere i dati e quindi pubblicare gli asset di dati in un catalogo in cui gli utenti possano trovarli. Quando i dati vengono modificati, è possibile reimportare i metadati relativi alle tabelle o ai file e arricchire gli asset di dati con il vocabolario di business e l'analisi della qualità dei dati. È possibile creare regole sempre più precise per proteggere i dati man mano che si espande il vocabolario di business. Durante il ciclo di governance dei dati, i data scientist e altri utenti di dati possono trovare dati attendibili nei cataloghi. La seguente illustrazione mostra il modo in cui la governance dei dati è un ciclo continuo di aggiornamento dei metadati per gli asset di dati per riflettere le modifiche nei dati e nel vocabolario di business.

Il ciclo delle attività di governance dei dati

Stabilisci il tuo vocabolario di business

  • Il team di governance può stabilire un vocabolario di business che descrive il significato dei dati con termini di business e il formato dei dati con classi di dati. Un vocabolario di business aiuta gli utenti di business a trovare più facilmente ciò che stanno cercando utilizzando termini non tecnici.
  • Il team può stabilire rapidamente il vocabolario di business importando il vocabolario di business esistente o importando Knowledge Accelerators che forniscono da decine a migliaia di risorse di governance.
  • L'amministratore di IBM Knowledge Catalog può personalizzare il flusso di lavoro, l'organizzazione, le proprietà e le relazioni delle risorse di governance.

Consultare Pianificazione dell'implementazione di un framework di governance.

Importare e arricchire gli asset di dati con il vocabolario di business

  • Gli steward di dati possono eseguire regolarmente i lavori di importazione e arricchimento dei metadati che aggiornano il catalogo con le modifiche alle tabelle o ai file dalle origini dati e assegnano automaticamente i termini di business e le classi di dati appropriati.
  • Quando il team aggiunge risorse utente di governance, i lavori di arricchimento dei metadati suggeriscono le nuove risorse utente agli asset di dati nuovi o aggiornati.
  • Quando gli steward dei dati confermano o regolano le assegnazioni dei termini di business durante l'arricchimento dei metadati, gli algoritmi di machine learning per l'assegnazione dei termini diventano più precisi per i tuoi dati.
  • Gli steward di dati possono configurare l'importazione e l'arricchimento dei metadati per l'esecuzione solo quando vengono rilevate modifiche.
  • È possibile utilizzare le funzionalità di arricchimento basate su gen AI per generare nomi descrittivi di asset e colonne, per generare descrizioni significative per asset e colonne e per assegnare termini commerciali.

Consultare Pianificazione della gestione degli asset di dati da condividere nei cataloghi.

Analizza qualità dei dati

  • Gli steward di dati possono analizzare la qualità dei dati con impostazioni predefinite durante l'arricchimento dei metadati. L'analisi della qualità dei dati viene applicata a ciascun asset nel suo insieme e alle colonne nelle tabelle.
  • Gli steward di dati possono creare definizioni di qualità dei dati personalizzate e applicarle in regole di qualità dei dati oppure applicare regole di qualità dei dati basate su SQL.

Consultare Pianificazione della gestione degli asset di dati da condividere nei cataloghi.

Proteggi i tuoi dati con le regole

  • Il team di governance può creare un piano per le regole di protezione dei dati scrivendo politiche che documentano gli standard e le linee guida dell'organizzazione per la protezione e la gestione dei dati. Ad esempio, una politica può descrivere una normativa specifica e il modo in cui una regola di protezione dei dati garantisce la conformità a tale normativa.
  • Il team di governance può creare regole di protezione dati che definiscono come mantenere private le informazioni private. Le regole di protezione dei dati vengono valutate automaticamente per l'applicazione ogni volta che un utente tenta di accedere a un asset di dati in un catalogo gestito sulla piattaforma. Le regole di protezione dati possono definire come controllare l'accesso ai dati, mascherare valori sensibili o filtrare le righe dagli asset di dati.
  • Il team può iniziare con le regole di protezione dei dati basate su tag personalizzati, utenti o classi di dati predefinite, termini di business e classificazioni. Quando il team di governance aggiunge le risorse di governance, il team può definire le regole di protezione dei dati in base al vocabolario aziendale.
  • I data engineer possono applicare le regole di protezione dei dati sui dati virtualizzati.
  • Gli ingegneri dei dati possono mascherare in modo permanente i dati negli asset di dati con flussi di mascheramento.

Vedere Pianificazione della protezione dei dati con regole.

Introduzione a IBM Knowledge Catalog

Le attività per iniziare a utilizzare IBM Knowledge Catalog dipendono dal tuo obiettivo. Le azioni che puoi eseguire sono definite dai tuoi ruoli di accesso del servizio Cloud Pak for Data . Alcune azioni hanno anche requisiti di ruolo dello spazio di lavoro, come essere un collaboratore in un catalogo o in una categoria.

Per controllare i tuoi ruoli di accesso del servizio, consulta Determinazione del tuo account IBM Cloud e dei ruoli di accesso del servizio. Per comprendere i ruoli di IBM Knowledge Catalog , vedi Ruoli utente e autorizzazioni.

La seguente tabella mostra gli obiettivi comuni, i ruoli di accesso al servizio Cloud Pak for Data richiesti e i link alle informazioni per iniziare.

Obiettivo Ruolo di accesso al servizio Cloud Pak for Data richiesto Ulteriori informazioni
Configurare o amministrare IBM Knowledge Catalog Responsabile Pianificazione dell'implementazione della governance dei dati
Impostazione di IBM Knowledge Catalog
Gestione di IBM Knowledge Catalog
Trovare asset o funzioni in un catalogo Qualsiasi ruolo Individuazione di asset in un catalogo
Ricerca di asset nella piattaforma
Aggiunta di un asset del catalogo ad un progetto
Dati curati CloudPak Data Steward o
CloudPak Data Engineer
Gestione dei dati
Pianificazione della gestione dei dati
Gestire la qualità dei dati CloudPak Data Steward o
CloudPak Data Engineer
Gestione della qualità dei dati
Crea risorse di governance CloudPak Data Steward o
CloudPak Data Engineer
Gestione delle risorse di governance
Importazione Knowledge Accelerators
Pianificazione dell'implementazione di un framework di governance
creare regole di protezione dei dati CloudPak Data Steward o
CloudPak Data Engineer
Regole di protezione dati
Pianificazione della protezione dei dati con regole
Esegui API IBM Knowledge Catalog Lo stesso ruolo per eseguire l'attività nell'interfaccia utente. - API IBM Knowledge Catalog
Genera report in IBM Knowledge Catalog Amministratore report Impostazione dei report

Ulteriori informazioni

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni