Importazione di metadati
È possibile acquisire e importare i metadati delle risorse e le informazioni sul lignaggio dei dati dell'organizzazione. Questi dati possono provenire da un'ampia varietà di fonti. Quando si importano i metadati delle risorse, vengono create le risorse.
- Servizi richiesti
- IBM Knowledge Catalog
- Manta Data Lineage (per importare i metadati del lignaggio)
- Cloud Object Storage (per importare i metadati del lignaggio)
- Autorizzazioni richieste
- Per creare, gestire ed eseguire un'importazione di metadati, devi disporre del ruolo Admin o Editor nel progetto.
- Per importare metadati in un catalogo, è necessario disporre anche del ruolo Admin o Editor nel catalogo in cui si desidera importare.
- Per configurare Cloud Object Storage per memorizzare i metadati di lignaggio, è necessario disporre dell'autorizzazione Manage data lineage.
- Connessioni supportate
- È possibile importare asset dalle fonti di dati elencate in Fonti di dati supportate per la cura e la qualità dei dati.
Panoramica
Il processo di importazione dei metadati prevede la configurazione della connessione all'origine dati e la specificazione dei parametri per il lavoro di importazione dei metadati. A seconda del tipo di metadati importati, che si tratti di metadati delle risorse o di metadati del lignaggio, potrebbe essere necessaria una configurazione dei prerequisiti.
Prerequisiti: Configurazione del lignaggio dei dati
Se si desidera importare i metadati del lignaggio, è necessario selezionare un'istanza di Cloud Object Storage per memorizzare i dati del lignaggio:
- Dal menu di navigazione, andare su Amministrazione > Configurazioni e impostazioni e aprire Impostazione lineage dati.
- Selezionare un'istanza di Cloud Object Storage in cui si desidera memorizzare i dati di discendenza.
Per ulteriori informazioni su IBM Cloud Object Storage, vedere IBM Cloud Object Storage su Cloud Pak for Data as a Service.
Passi per l'importazione dei metadati
I passi seguenti forniscono una panoramica del processo di importazione dei metadati. Seguite i link di ogni passo per maggiori dettagli.
- Creare una definizione di origine dati.
- Creare una connessione all'origine dati in un progetto.
- Creare un'importazione di metadati.
Ogni fonte di dati richiede diversi dettagli di connessione e configurazione. Queste informazioni si trovano in ogni argomento relativo alle connessioni nella sezione Connettori e nella sezione Connettori supportati per l'importazione del lignaggio. Per verificare da quali fonti di dati è possibile importare i metadati, vedere Fonti di dati supportate per la curation e la qualità dei dati.
Quando si crea un'importazione di metadati, il processo di importazione dei metadati inizia immediatamente, a meno che non sia stato programmato per essere eseguito a un'ora specifica o configurato per non essere eseguito affatto.
Tipi di metadati
È possibile importare questi tipi di metadati:
- Metadati asset
- I metadati delle risorse forniscono le informazioni necessarie per creare una risorsa in un progetto o in un catalogo. I metadati dell'asset forniscono i dettagli dell'asset, le relazioni e l'anteprima del contenuto dell'asset. Per gli asset di dati, i metadati consentono anche la profilazione dei dati, l'analisi della qualità dei dati e l'accesso alle persone che lavorano con i dati.
- Metadati di derivazione
- I metadati di lignaggio forniscono le informazioni di lignaggio per il grafico di lignaggio dei dati. Il percorso dei dati mostra da dove provengono i dati, come cambiano e dove si spostano nel tempo.
Tipi di attività
È possibile creare i seguenti tipi di risorse importando i metadati:
- Asset di dati
- Tabelle o file di dati da una connessione. Se si desidera eseguire regole di arricchimento dei metadati o di qualità dei dati sulle risorse importate, è necessario importarle in un progetto.
- Libri di copia Cobol
- La struttura dei dati di un programma COBOL. È possibile importare i copybook Cobol nei progetti e nei cataloghi. Tali risorse non possono essere scaricate, profilate, arricchite attraverso l'arricchimento dei metadati o utilizzate in Data Refinery.
- Attività di script di trasformazione
- Le trasformazioni dei dati che modificano il formato, la struttura o i valori dei dati e che di solito fanno parte dei processi ETL (extract, transform, and load).
Passi successivi
Ulteriori informazioni
- Tutorial sulla governance dei dati: Curate i dati di alta qualità
- Fonti di dati supportate per la cura e la qualità dei dati
- Come contrassegnare un progetto come sensibile
- IBM Manta Data Lineage su Cloud Pak for Data as a Service
Argomento principale Curazione dei dati