Ogni origine dati o asset deve essere associato e pubblicato nel modello di dati prima di poter essere utilizzato nelle funzioni IBM Match 360 come la corrispondenza.
- Autorizzazioni richieste
- Per aggiungere, associare e pubblicare asset di dati in un'istanza di dati master, è necessario essere un membro del gruppo utenti DataEngineer per il servizio IBM Match 360 .
- Se si utilizza un catalogo gestito, è possibile solo visualizzare o aggiungere le risorse del catalogo di cui si è il proprietario dell'asset di dati.
IBM Match 360 include una potente funzionalità di automazione che elimina la necessità per i data engineer di associare manualmente ogni colonna di dati nel modello. La funzione di associazione automatica rileva, analizza e categorizza ciascuna colonna di dati per gli attributi o i campi corrispondenti nel modello di dati. Prima di poter eseguire l'associazione automatica, è necessario creare il profilo dei dati. La creazione profili analizza e classifica i dati per consentire l'esecuzione del processo di associazione automatica.
La creazione profili e l'associazione automatica sono supportati solo per i tipi di record persona e organizzazione. Per altri tipi di record, associare manualmente le colonne al modello dati.
In questo argomento:
- Aggiunta di dati record da un file di dati flat
- Aggiunta di dati o origini tramite il progetto
- Associazione dei dati al modello dati
- Applicazione di un modello di associazione ad un asset di dati
- Aggiunta di dati di relazioni da un file di dati flat
- Pubblicazione dei dati di esempio
Aggiunta di dati record da un file di dati flat
Per aggiungere dati record in IBM Match 360 da un file di dati CSV o TSV:
Dal menu di navigazione dei dati anagrafici, fare clic sull'icona delle attività '.
Nella barra delle azioni, fare clic su Aggiungi dati o sull'icona Carica risorsa nel progetto '.
Dal pannello Dati che si apre, scegliere se aggiungere i dati tramite caricamento, dal progetto o dal catalogo. Per caricare un file di dati, scegliere Carica.
Sul computer locale, selezionare un file di dati flat in formato CSV o TSV e trascinarlo nel pannello Dati. Una volta terminato il caricamento, il file viene aggiunto all'elenco di riepilogo degli asset.
Nella scheda Attività, utilizzare la tabella di riepilogo delle attività per esaminare i dettagli della nuova attività aggiunta e delle altre attività di dati nel sistema.
Se la risorsa non ha alcuna informazione nella colonna Contenuto della risorsa, è necessario definire il tipo di dati che la risorsa contiene, ad esempio un tipo di record specifico. È importante assegnare il tipo di contenuto corretto a ogni risorsa, in modo che IBM Match 360 possa trovare la parte del modello di dati che meglio si adatta ai dati. Le risorse che non hanno un tipo di contenuto definito hanno uno stato Mancante tipo di dati della risorsa. Non è possibile mappare una risorsa senza aver prima definito il suo tipo di contenuto.
Per definire il tipo di contenuto di una risorsa, selezionarlo dall'elenco a discesa nella colonna Contenuto della risorsa del record. Lo stato della risorsa cambia in Pronto per la mappatura.
Se un tipo di dati appropriato non è presente nell'elenco dei contenuti delle risorse, potrebbe essere necessario personalizzare il modello di dati. Per ulteriori informazioni, consultare Personalizzazione del modello di dati.
Passo successivo: Associa i dati nel modello di dati
Aggiunta di dati o origini tramite il progetto
È possibile aggiungere asset di dati, origini o connessioni a IBM Match 360 tramite il proprio progetto.
È possibile utilizzare IBM Match 360 come origine dati o destinazione connessa. Per informazioni sull'impostazione e l'uso della connessione IBM Match 360 , consultare IBM Match 360.
Qualsiasi file di asset di dati che si desidera caricare in IBM Match 360 deve includere un'estensione file di un tipo supportato, ad esempio .csv
o .tsv
. Questo requisito comprende gli asset già presenti nel progetto. Se un nome asset nel progetto non include un'estensione file supportata, verrà visualizzato in grigio quando si tenta di aggiungerlo. Per modificare il nome di un asset nel progetto, andare alla scheda Asset del progetto, selezionare l'asset, quindi modificare il nome nel pannello Informazioni su questo asset .
Guarda questo video per vedere come creare una connessione e aggiungere i dati collegati a un progetto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Trascrizione del video Ora Trascrizione 00:00 Questo video mostra come impostare una connessione a un'origine dati e come aggiungere i dati connessi a un progetto. 00:08 Se si dispone di dati memorizzati in un'origine dati, è possibile impostare una connessione a tale origine dati da qualsiasi progetto. 00:16 Da qui, è possibile aggiungere diversi elementi al progetto. 00:20 In questo caso, si desidera aggiungere una connessione. 00:24 Puoi creare una nuova connessione a un servizio IBM , come IBM Db2 e Cloud Object Storage, o a un servizio di terze parti, come Amazon, Microsoft o Apache. 00:39 E puoi filtrare l'elenco in base a servizi compatibili. 00:45 È inoltre possibile aggiungere una connessione creata a livello di piattaforma, che può essere utilizzata tra progetti e cataloghi. 00:54 In alternativa, puoi creare una connessione a uno dei tuoi servizi IBM Cloud di cui è stato eseguito il provisioning. 00:59 In questo caso, seleziona il servizio di cui è stato eseguito il provisioning IBM Cloud per Db2 Warehouse on Cloud. 01:08 Se le credenziali non sono prepopolate, puoi ottenere le credenziali per l'istanza dalla pagina di avvio del servizio IBM Cloud . 01:17 Innanzitutto, verificare la connessione e quindi creare la connessione. 01:25 La nuova connessione viene visualizzata nell'elenco degli asset di dati. 01:30 Successivamente, aggiungere gli asset di dati connessi a questo progetto. 01:37 Seleziona l'origine - in tal caso, è la connessione Db2 Warehouse on Cloud appena creata. 01:43 Quindi selezionare lo schema e la tabella. 01:50 È possibile vedere che questo aggiungerà un riferimento ai dati all'interno di questa connessione e lo includerà nel progetto di destinazione. 01:58 Fornire un nome e una descrizione e fare clic su "Crea". 02:06 I dati vengono ora visualizzati nell'elenco di asset di dati. 02:09 Aprire il dataset per ottenere un'anteprima e da qui è possibile passare direttamente alla rifinitura dei dati. 02:17 Trova ulteriori video nella documentazione Cloud Pak for Data as a Service .
Per ulteriori informazioni relative all'aggiunta di dati direttamente al progetto, consultare Aggiunta di dati a un progetto.
Dopo aver aggiunto i dati, è necessario associarli nel modello dati IBM Match 360 . Per i dettagli, consultare Associa i dati nel modello dati.
Associazione dei dati al modello di dati
Prima di poter pubblicare un asset di dati da utilizzare in IBM Match 360, è necessario associarlo. Ciascuna colonna di una risorsa deve essere mappata su un corrispondente attributo del modello di dati o essere esclusa.
Per associare un asset di dati, sono disponibili diverse opzioni:
- È possibile associare manualmente ogni colonna.
- È possibile mappare ogni colonna con l'aiuto del profiling e dell'automapping.
- È possibile applicare un modello di associazione.
Ricordo: Per utilizzare le funzioni di profilazione e mappatura automatica di IBM Match 360, l'implementazione di IBM Cloud Pak for Data deve includere IBM Knowledge Catalog.
Per informazioni dettagliate sulla mappatura manuale o sull'uso della mappatura automatica, leggere le procedure seguenti. Per dettagli sull'applicazione di un modello di associazione, consultare Applicazione di un modello di associazione a un asset di dati.
Per associare un asset di dati nel modello di dati IBM Match 360 :
Nella schermata di riepilogo delle risorse, fare clic sulla scheda Mappatura.
Dall'elenco Asset, fare clic sull'asset di dati che si desidera associare al sistema.
Per aiutarvi a trovare l'asset che state cercando, potete effettuare una ricerca per nome dell'asset o filtrare in base al numero di colonne, al tipo di record, allo stato di mappatura, allo stato di pubblicazione o ai modelli di mappatura disponibili. Fare clic sull'icona del filtro " per applicare un filtro.
I dati dell'asset selezionato vengono visualizzati in formato tabella con un numero di righe e colonne. Ciascuna colonna rappresenta un attributo che deve essere associato a un tipo di attributo corrispondente nel modello dati. Quando si apre per la prima volta un'origine dati o un asset, ogni colonna viene contrassegnata con un tag Non associato .
Suggerimento: è possibile associare manualmente ciascuna colonna, se si desidera, ma è possibile velocizzare notevolmente il processo di associazione sfruttando la funzione di associazione automatica.Nel pannello dei dettagli della mappatura, esaminare le statistiche della mappatura per questo asset. A colpo d'occhio, è possibile vedere quante colonne di dati di questo asset sono state mappate, se ce ne sono.
Per abilitare l'associazione automatica per questa origine o asset, è necessario prima creare il profilo dei dati. Fare clic su Dati del profilo.
La creazione profili analizza e classifica i dati per consentire l'esecuzione del processo di associazione automatica. Il completamento della creazione profili può richiedere del tempo, quindi viene eseguito in background in modo da poter continuare a lavorare. È possibile avviare la revisione e l'associazione manuale di alcune colonne.
L'associazione automatica non sovrascriverà mai le associazioni manuali eseguite in precedenza.
Al termine della profilazione, fare clic su Automatizza risorsa. IBM Match 360 with Watson analizza i dati e associa automaticamente il maggior numero di colonne possibile nel modello di dati. Anche se non è possibile associare una colonna specifica, la funzione di associazione automatica può suggerire alcune delle selezioni di associazione più probabili.
Esaminare i risultati dell'associazione automatica. Se una delle associazioni non è corretta o se una colonna rimane non associata, associarla manualmente correttamente. In alternativa, se una colonna specifica non è necessaria, è possibile escluderla dal caricamento in IBM Match 360 selezionando Escludi colonna.
Per associare manualmente una colonna, selezionarla, quindi utilizzare il pannello Destinazioni di associazione per cercare e selezionare l'attributo o il campo appropriato dal modello dati. Fare clic su Associa e salva nel modello dati.
Se un attributo o un campo appropriato non esiste nel modello dati, è possibile crearne uno dal pannello Destinazioni di associazione . Fare clic su Nuovo > Crea attributo o Nuovo > Crea campo per definire e fornire i dettagli di un nuovo attributo o campo.
Se si sceglie di creare un Attributo semplice invece di assegnare un tipo di attributo esistente, il nuovo attributo semplice viene aggiunto direttamente al tipo di record nella scheda Modeling . Non è categorizzato in Tipi attributo.
Scorrere orizzontalmente le colonne per assicurarsi che ogni colonna nell'origine dati o nell'asset sia associata. Se le colonne non sono associate, associate automaticamente o escluse esplicitamente dall'associazione, l'asset di dati rimane nello stato Associazione in corso .
Per escludere una colonna dal caricamento in IBM Match 360, selezionare la colonna, quindi selezionare Escludi colonna.
Importante: se l'attributo
record_source
è associato a un campo nell'asset, tale campo deve essere popolato in tutti i record dell'asset. Se a un record manca un valore per il camporecord_source
, l'asset non può essere caricato correttamente. Se non si associa l'attributorecord_source
a un campo esistente, viene derivato un nome origine record predefinito utilizzando il nome asset.Una volta terminata l'associazione dell'asset di dati, è possibile pubblicare i dati nel sistema.
- Se il modello di dati è nuovo o modificato, è necessario pubblicarlo prima facendo clic sull'icona di pubblicazione del modello " nella barra delle azioni. Attendere il completamento del lavoro di pubblicazione.
- Per pubblicare i dati, fare clic sull'icona di pubblicazione dei dati " nella barra delle azioni. Attendere il completamento del lavoro di pubblicazione.
Tornare alla pagina della panoramica di configurazione selezionando Panoramica di configurazione dal menu di navigazione.
Nella pagina della panoramica della configurazione, confermare di avere almeno un'origine dati o un asset aggiunto e associato.
Applicazione di un modello di associazione a un asset di dati
I modelli di associazione consentono di mantenere la coerenza tra gli asset di dati simili, semplificando la ripetizione delle selezioni di associazione dati per gli asset compatibili.
Un modello di associazione viene creato automaticamente quando si associa manualmente un asset di dati. Il modello salva le selezioni di associazione colonna in modo che possano essere riutilizzate da altri asset di dati che condividono lo stesso formato di colonna e tipo di record. Applicando un modello di mappatura, è possibile evitare di associare manualmente gli asset di dati simili agli asset esistenti già mappati.
IBM Match 360 identifica quando un nuovo asset è compatibile con un pattern di mappatura esistente nel sistema e notifica che è possibile utilizzare un pattern per evitare il lavoro di mappatura manuale.
I pattern di associazione possono essere creati associando manualmente gli asset di dati oppure possono essere importati utilizzando le istantanee di configurazione.
Per informazioni sulla gestione e l'applicazione dei pattern di associazione utilizzando le snapshot di configurazione, consultare Salvataggio e caricamento delle snapshot di configurazione.
Per applicare un modello di associazione a un asset di dati associato o non associato:
Nella schermata di riepilogo delle risorse, fare clic sulla scheda Mappatura.
Dall'elenco Asset, individuare uno o più asset di dati a cui si desidera applicare un modello di associazione.
Per trovare le risorse desiderate, è possibile effettuare una ricerca per nome o filtrare in base al numero di colonne, al tipo di record, allo stato di mappatura, allo stato di pubblicazione o ai modelli di mappatura disponibili. Fare clic sull'icona del filtro " per applicare un filtro.
Selezionare gli asset di dati a cui si desidera applicare un modello di associazione.
- Per applicare un modello di mappatura a un singolo asset di dati, fare clic sull'icona Applica modello di mappatura ' accanto al nome dell'asset.
- Per applicare un modello di associazione a uno o più asset di dati, selezionare la casella di controllo accanto al nome dell'asset, quindi fare clic su Applica associazione nell'elenco Asset. Gli asset di dati selezionati devono condividere la stessa struttura e lo stesso formato di colonna per poter condividere un modello di associazione.
La pagina Applica modelli di mappatura mostra un elenco di modelli di mappatura disponibili. Se esiste un modello di corrispondenza raccomandato per questa risorsa, accanto ad esso è presente l'icona del badge " .
Esaminare i modelli di mappatura. È possibile visualizzare gli altri asset a cui si applica attualmente il modello di associazione, insieme al tipo di record applicabile, alla data dell'ultimo aggiornamento e all'origine originale.
Per ulteriori dettagli e per confrontare i pattern di mappatura tra loro, selezionare un pattern di mappatura primario, quindi fare clic su Confronta pattern di mappatura. Scorrere orizzontalmente i modelli per confrontarli con quello selezionato. Scorrere verticalmente la pagina per visualizzare ulteriori dettagli come i dettagli dell'istantanea e le associazioni di colonna.
Selezionare il modello di associazione che si desidera applicare agli asset di dati selezionati, quindi fare clic su Avanti.
Esaminare le modifiche di associazione selezionate. Confermare di aver scelto gli asset e il pattern di associazione corretti.
L'applicazione di un modello di associazione può modificare il tipo di record di un asset. Fare attenzione a non modificare erroneamente il tipo di record. Le modifiche di associazione effettuate applicando un modello di mappatura non possono essere annullate senza riassociare manualmente l'asset.
Fare clic su Fine per applicare il modello di associazione.
Dopo aver applicato il modello di mappatura, è possibile pubblicare i dati nel sistema.
- Se il modello di dati è nuovo o modificato, è necessario pubblicarlo prima facendo clic sull'icona di pubblicazione del modello " nella barra delle azioni. Attendere il completamento del lavoro di pubblicazione.
- Per pubblicare i dati, fare clic sull'icona di pubblicazione dei dati " nella barra delle azioni. Attendere il completamento del lavoro di pubblicazione.
Aggiunta di dati di relazioni da un file di dati flat
Prima di poter caricare un asset di dati di relazioni in IBM Match 360, è necessario definire il tipo di relazione corrispondente nel modello di dati. Per i dettagli, consultare Personalizzazione del proprio modello dati.
Gli asset di dati di relazione sono formattati in righe delimitate (CSV o TSV). Esistono diverse colonne di dati richieste:
- ID record per entrambe le parti in ogni relazione
- Tipi di record per entrambe le parti in ogni relazione
- Origini record per entrambe le parti in ogni relazione
È possibile creare l'asset di dati di relazioni manualmente, tramite un processo ETL o utilizzando l'applicazione in cui sono memorizzate le proprie relazioni.
Per aggiungere dati di relazione in IBM Match 360 da un file di dati CSV o TSV:
Dal menu di navigazione dei dati anagrafici, fare clic sull'icona delle attività '.
Caricare, associare e pubblicare gli asset di dati di record in IBM Match 360. Questi asset di dati devono contenere i dati del record che si desidera associare utilizzando le relazioni. Per i dettagli, consultare Aggiunta di dati record da un file di dati flat e Associazione dei propri dati nel modello dati.
Caricare il file di asset di dati di relazione:
a. Nella barra delle azioni, fare clic su Aggiungi dati o sull'icona Carica risorsa nel progetto '.
b. Dal pannello Dati che si apre, scegliere se aggiungere i dati tramite caricamento, dal progetto o dal catalogo. Per caricare un file di dati, scegliere Carica.
Nota: se i dati includono cataloghi gestiti, potrebbe non essere possibile visualizzare o aggiungere alcune risorse del catalogo. In base alle autorizzazioni di cui si dispone, è possibile visualizzare solo le risorse del catalogo di cui si è proprietari o che si gestiscono.c. Sul computer locale, selezionare un file di dati flat contenente i dati di relazione in formato CSV o TSV e trascinarli nel pannello Dati. Una volta terminato il caricamento, il file viene aggiunto all'elenco di riepilogo degli asset.
Esaminare i dettagli dell'asset di relazioni appena aggiunto.
Passare con il mouse sulla riga dell'asset di relazioni nell'elenco di riepilogo degli asset e fare clic sul menu di overflow a tre punti.
Fare clic su Imposta proprietà asset.
Selezionare Relazioni dall'elenco Categoria dati asset .
Selezionare il tipo di relazione corretto dall'elenco Tipo di dati asset e fare clic su Salva.
Se il tipo di relazione appropriato non è presente nell'elenco dei tipi di dati dell'asset, potrebbe essere necessario personalizzare il proprio modello di dati. Per ulteriori informazioni, consultare Personalizzazione del modello di dati.
Associare e pubblicare l'asset di dati di relazione. Per i dettagli, consultare Associazione dei dati nel modello dati. Assicurarsi di associare ciascuna delle colonne di dati richieste:
from record ID
,to record ID
,from record type
,to record type
,from record source
eto record source
.Limitazione : i dati di relazione non supportano la creazione profili e l'associazione automatica. Associare manualmente le colonne al modello di dati.
Pubblicazione dei dati di esempio
Se non hai i tuoi asset di dati pronti per l'uso, ma vuoi iniziare a utilizzare il servizio IBM Match 360 , carica invece il modello e i dati di esempio forniti.
Per caricare i dati di esempio IBM Match 360 :
- Andare alla home page dei dati master.
- Dal riquadro Master data , fai clic su Publish sample model.
- Una volta completata la pubblicazione del modello di esempio, fare clic su Pubblica dati di esempio.
- In alternativa, è possibile accedere alla pagina Lavori per osservare l'avanzamento dei lavori di caricamento dei campioni. Se non si desidera visualizzare lo stato di avanzamento, è possibile passare a un'altra schermata e i lavori continueranno a lavorare in background.
Passi successivi
Ulteriori informazioni
- Salvataggio e caricamento delle snapshot di configurazione
- Utilizzo dei dati gestiti in IBM Match 360
- Esercitazione Master Data Management : configurare una vista a 360 gradi
Argomento principale Configurazione dei dati master