È possibile importare metadati tecnici per aggiungere asset di dati a un progetto o a un catalogo. In un progetto, è possibile preparare e analizzare i dati prima di pubblicarlo in un catalogo.
Importare metadati in un progetto come asset di dati per preparare e analizzare i dati prima di pubblicarli in un catalogo. Creare un profilo di tali asset di dati, analizzare la qualità dei dati e assegnare termini per fornire il contesto di business eseguendo l'arricchimento dei metadati. Per eseguire un'analisi di qualità più approfondita, eseguire le regole di qualità dei dati sugli asset di dati. È anche possibile aggiungere asset di dati ad un catalogo direttamente se i dati sono pronti per essere condivisi senza ulteriore preparazione.
È possibile utilizzare le API invece dell'interfaccia utente per richiamare l'elenco di connessioni supportate o per creare un asset di importazione metadati. I collegamenti a queste API sono elencati in Ulteriori informazioni .
- Tipi di asset
Gli asset di dati che rappresentano tabelle o file da una connessione a un'origine dati esterna.
Nota: per le cartelle di lavoro Microsoft Excel, ogni foglio viene importato come un asset di dati separato. Il nome dell'asset di dati è uguale al nome del foglio Excel.- Connessioni supportate
Consultare la colonna Metadata import in Connettori supportati.
- Autorizzazioni richieste
Per creare, gestire ed eseguire un'importazione di metadati, è necessario disporre dei seguenti ruoli e autorizzazioni:
- Il ruolo Admin o Editor nel progetto.
- Il ruolo Admin o Editor nel catalogo in cui si desidera importare o pubblicare gli asset.
- Accesso alle connessioni alle origini dati degli asset di dati da importare e SELECT o un'autorizzazione simile sui database corrispondenti.
Panoramica
L'importazione dei metadati per il rilevamento implica il seguente processo:
- Identificare l'origine dati da importare. È possibile che sia già stata definita una connessione a questa origine dati. In caso contrario, assicurarsi di disporre delle credenziali per connettersi. Per un elenco delle connessioni supportate, consultare Connettori supportati.
- In un progetto, creare un asset di importazione metadati per configurare i dettagli di importazione come l'ambito e la destinazione dell'importazione e la pianificazione per il processo di importazione.
- Importare gli asset nel progetto o nel catalogo. Quando si accede ad un asset di dati importato, i dati vengono richiamati dinamicamente dall'origine dati.
- Analizzare e visualizzare in anteprima i metadati importati in un progetto e condividerli nel catalogo. È possibile creare profili per singoli asset uno alla volta dalla scheda Profilo di ciascun asset. È anche possibile creare profili per più asset di dati in parallelo e aggiungere un contesto aziendale creando ed eseguendo un asset di arricchimento dei metadati.
Guarda questo breve video per vedere come importare i metadati dell'asset da un'origine esterna in un progetto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Creazione di un asset di importazione metadati e importazione di metadati
Per creare un asset di importazione metadati e un job per l'importazione di metadati in un progetto o in un catalogo:
Apri un progetto, vai al progetto Risorsa pagina e fare clic Nuova risorsa > Importa metadati per risorse dati .
Specificare un nome per l'importazione dei metadati. Facoltativamente, è possibile fornire una descrizione.
Facoltativo: selezionare le tag da assegnare all'asset di importazione dei metadati per semplificare la ricerca. È possibile creare nuove tag immettendo il nome tag e premendo Invio.
Selezionare la destinazione di importazione. È possibile importare i metadati nel progetto in cui si sta lavorando o in qualsiasi catalogo di cui si è membri.
Importare i metadati in un progetto per l'analisi prima di decidere quali asset condividere in un catalogo affinché altri utenti possano utilizzarli. In un progetto, è possibile eseguire l'arricchimento dei metadati e le regole di qualità dei dati sugli asset di dati importati.
Se si conosce bene il contenuto degli asset di dati, è possibile importarne i metadati direttamente nel catalogo.
Se il progetto è contrassegnato come sensibile, è possibile importarlo solo nel progetto, non in un catalogo.
Definire un ambito per l'importazione dei metadati.
Selezionare un asset di connessione esistente come origine dei dati, oppure fare clic su Crea una nuova connessione e crea un asset di connessione. È possibile importare metadati dalle origini dati elencate in Connettori supportati.
Selezionare gli elementi che si desidera includere nell'importazione e fare clic su Seleziona. A seconda della dimensione e del contenuto dell'origine dati, è possibile che non si desideri importare tutti gli asset ma un sottoinsieme selezionato. È possibile includere schemi o cartelle completi oppure eseguire il drill - down a singole tabelle o file. Quando si seleziona uno schema o una cartella, è possibile visualizzare immediatamente il numero di elementi che contiene. Pertanto, è possibile decidere se si desidera includere l'intero insieme o se un sottoinsieme soddisfa meglio il proprio scopo.
Notare che non è possibile importare i dati dagli schemi in cui il nome contiene caratteri speciali.
Rivedere l'ambito selezionato. È possibile eliminare direttamente gli asset dall'ambito dati oppure è possibile rielaborare l'intero ambito facendo clic su Modifica ambito dati. Una volta terminato il perfezionamento dell'ambito dati, fare clic su Avanti.
Definire se si desidera eseguire i lavori di importazione pianificati. Se non si imposta una pianificazione, si esegue l'importazione quando si salva l'asset di importazione metadati. È possibile rieseguire l'importazione manualmente in qualsiasi momento. Se si seleziona di eseguire l'importazione in base a una pianificazione specifica, definire la data e l'ora in cui si desidera eseguire il lavoro. È possibile pianificare esecuzioni singole e ricorrenti. Se si pianifica una singola esecuzione, il job viene eseguito esattamente una volta al giorno e all'ora specificati. Se si pianificano le esecuzioni ricorrenti, il lavoro viene eseguito per la prima volta alla data / ora indicata nella sezione Ripeti .
Facoltativamente, modificare il nome del lavoro di importazione. Il nome predefinito è il lavoro metadata_import_name .
È possibile accedere successivamente al job di importazione creato dall'asset di importazione dei metadati o dalla pagina Lavori del progetto. Vedere Lavori.
Facoltativo. Personalizza il comportamento dell'importazione. È possibile scegliere di impedire l'aggiornamento di specifiche proprietà e di eliminare gli asset esistenti non inclusi nella reimportazione.
- Aggiorna alla reimportazione
- Per impostazione predefinita, tutte le proprietà dell'asset vengono aggiornate quando gli asset vengono reimportati. Se non si desidera che i nomi degli asset, le descrizioni degli asset o le descrizioni delle colonne vengano aggiornate durante la reimportazione, deselezionare le rispettive caselle di spunta.
- Elimina alla reimportazione
- Per impostazione predefinita, nessun asset viene eliminato dal progetto o catalogo di destinazione quando si riesegue l'importazione. Per ripulire il progetto o il catalogo di destinazione, è possibile scegliere di eliminare gli asset che non sono più disponibili nell'origine dati o gli asset che sono stati rimossi dall'ambito di importazione durante la reimportazione.
- Escludi da importazione
- Per le importazioni di metadati eseguite su database relazionali, è possibile selezionare se si desidera importare tutti i tipi di asset relazionali o se si desidera escludere tabelle o viste, alias e sinonimi. Queste opzioni si escludono reciprocamente.
- Importa proprietà aggiuntive
- Per le importazioni di metadati eseguite su database relazionali, è possibile selezionare se le chiavi primarie ed esterne che potrebbero essere definite nel database vengono importate.
Ulteriori opzioni di importazione:
- Importazione incrementale
Abilitare le importazioni incrementali per importare solo gli asset di dati nuovi o modificati quando si riesegue l'importazione. Questa opzione è disponibile solo per le origini dati che supportano le importazioni incrementali:
L'aggiornamento o la rimozione della descrizione di un asset nell'origine dati non modifica la data di modifica dell'asset. La data di modifica, inoltre, non cambia per gli asset rimossi dall'elenco degli asset importati. Pertanto, tali attività non sono prese in considerazione per le importazioni incrementali. Inoltre, gli asset eliminati dall'origine dati o dall'ambito non vengono rilevati con le importazioni incrementali. Pertanto, tali asset non vengono contrassegnati come Rimosso o eliminati come specificato con le impostazioni Elimina alla reimportazione . Per visualizzare tali modifiche riflesse, disabilitare le importazioni incrementali per reimportare tutti gli asset nell'ambito dati.
Importante: le importazioni incrementali potrebbero non funzionare se l'origine dati e il luogo da cui si accede all'account Cloud Pak for Data si trovano in fusi orari differenti. Se accedi al tuo account Cloud Pak for Data in un fuso orario che precede il fuso orario dell'origine dati, il lavoro di importazione dei metadati potrebbe non rilevare gli asset che sono stati aggiunti o modificati dopo l'ultima esecuzione dell'importazione. In questo caso, disattivare l'importazione incrementale in modo che tutti gli asset vengano inclusi quando si riesegue l'importazione.
Perché le importazioni incrementali funzionino, l'origine dati deve essere nel fuso orario GMT indipendentemente dal fuso orario dell'account Cloud Pak for Data .- Raccogli metadati dal catalogo del database
Per le importazioni di metadati eseguite sui database relazionale, è possibile scegliere di importare i metadati dal catalogo del database. Pertanto, l'utente che esegue l'importazione deve accedere solo al catalogo del database ma non deve disporre dell'autorizzazione SELECT sui dati effettivi. Non è possibile creare il profilo degli asset importati o utilizzarli nell'arricchimento dei metadati.
Esaminare la configurazione di importazione metadati. Per apportare modifiche, fare clic sull'icona Modifica sul riquadro e aggiornare le impostazioni.
Fare clic su Crea. L'asset di importazione metadati viene aggiunto al progetto e viene creato un lavoro di importazione metadati. Se non è stata configurata una pianificazione, l'importazione viene eseguita immediatamente. Se è stata configurata una pianificazione, l'importazione viene eseguita in base alla pianificazione definita.
Importante: gli asset della stessa connessione che sono stati già importati tramite un'altra importazione di metadati non vengono importati di nuovo ma vengono aggiornati. Tali asset non sono più visualizzati nell'importazione di metadati iniziale. Solo l'importazione dei metadati eseguita più di recente contiene gli asset.
In base al risultato dell'esecuzione del lavoro di importazione dei metadati, viene visualizzato un messaggio di completamento o una notifica di errore.
Viene visualizzato un messaggio di completamento quando l'esecuzione del lavoro è stata completata correttamente, è stata completata con avvertenze o è stata completata con errori. Viene visualizzata una notifica di errore se l'intera esecuzione del lavoro non è riuscita. Il tipo di notifica contiene un collegamento al log di esecuzione del job che fornisce dettagli sull'esecuzione del job specifico.
Quando l'importazione è completa, è possibile visualizzare l'elenco di asset con le seguenti informazioni:
- Il nome dell'asset, che fornisce un link all'asset nel progetto o nel catalogo.
- Il tipo di asset, ad esempio
Data
, e il formato, ad esempioRelational table
. - Il contesto dell'asset, ad esempio il percorso del file o del parent.
- La data e l'ora dell'ultima importazione dell'asset.
- Lo stato di importazione, che può essere
Imported
per i dati importati correttamente,In progress
oRemoved
se non è stato possibile reimportare l'asset.
È possibile utilizzare la maggior parte degli asset di dati importati allo stesso modo degli asset di dati connessi. Gli asset importati hanno un tag assegnato automaticamente che riflette il padre dell'asset, se applicabile.
Per creare il profilo, analizzare e fornire il contesto aziendale agli asset di dati importati, creare un asset di arricchimento dei metadati e includere l'asset di importazione dei metadati nell'ambito dei dati.
Ulteriori informazioni
Passi successivi
- Profilo di singoli asset
- Profilo e analisi di più asset
- Gestione delle importazioni di metadati esistenti
Argomento principale: Importazione di metadati