IBM Match 360 crea entità dati master eseguendo un algoritmo di corrispondenza sui record forniti da uno o più asset di dati. Entità e record sono definiti e composti in base al modello di dati personalizzabile IBM Match 360 .
In questo argomento:
Record ed entità
Ogni entità è un oggetto di dati master che fornisce una vista a 360 gradi di una persona, di un'organizzazione o di un'altra entità. Uno o più record di dati possono contribuire a una singola entità.
Un record è una serie di informazioni demografiche che rappresenta un singolo punto di vista di una persona o di un'organizzazione, preso da una singola origine dati. Se la stessa persona o organizzazione viene visualizzata in più origini dati, ciascuno dei record verrà collegato insieme dall'algoritmo di corrispondenza come una singola entità. I record sono costituiti da attributi e valori di campo che descrivono la persona o l'organizzazione.
Un' entità di dati master è una composizione di record che IBM Match 360 determina per la corrispondenza. Il modello di dati può definire due categorie di entità: identità o associazione. Ogni entità include uno o più record di membri che l'algoritmo di corrispondenza ha collegato tra loro. IBM Match 360 determina in modo intelligente l'insieme più probabile di attributi e valori di campo che descrivono correttamente l'entità rappresentata e li visualizza nella vista dell'area di lavoro dei dati master.
Uno o più record membro possono contribuire a una vista entità. I record del membro che costituiscono un'entità potrebbero cambiare se l'algoritmo corrispondente viene eseguito di nuovo con impostazioni differenti, ad esempio con una soglia di collegamento automatico differente o una serie diversa di selezioni di attributi corrispondenti.
È possibile avere un'entità composta da un singolo record. Quando ciò si verifica, l'entità è nota come singleton.
Ogni entità viene creata attorno a un record centrale. Il record meno recente in un'entità viene considerato come il record centrale. I record di centro sono la base dell'entità e non possono essere scollegati o spostati in un'altra entità.
Ogni record che contribuisce a un'entità viene rappresentato come un margine grafico tra i record e l'entità, come determinato dall'elaborazione della corrispondenza. Quando si riesegue l'algoritmo di corrispondenza, i margini che rappresentano i collegamenti vengono aggiornati.
Tipi di entità
Quando si definisce un nuovo tipo di entità nel proprio modello di dati, è necessario decidere quale sia lo scopo di questa entità:
Le entità Identity collegano i record che sembrano tutti rappresentare la stessa persona, organizzazione o oggetto del mondo reale. Condividono un'identità comune. Ad esempio, un'entità Business Partner può essere utilizzata per associare i record dell'organizzazione all'interno dei dati che rappresentano la stessa azienda del mondo reale.
Le entità Associazione collegano i record che devono essere associati per un altro motivo, come un indirizzo condiviso, un datore di lavoro o una decisione di acquisto. Un esempio comune di un tipo di entità associazione è un nucleo familiare. È possibile creare un tipo di entità Nucleo familiare che corrisponda ai membri di un determinato nucleo familiare in una singola entità. Utilizzando le entità di gestione familiare, è possibile tenere traccia e analizzare il comportamento e l'attività in base al nucleo familiare.
Entità familiari
Guarda il seguente video per scoprire come utilizzare le entità di associazione per individuare le famiglie all'interno dei dati IBM Match 360 .
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Quando si crea un tipo di entità di associazione per tenere traccia e identificare i record persona che condividono un nucleo familiare, è necessario considerare alcuni fattori importanti. Stabilire i criteri di gestione familiare è un primo passo fondamentale nella gestione e nella formazione delle famiglie. Le famiglie possono essere definite in base a criteri espliciti, criteri espressi o una combinazione dei due.
I criteri espliciti possono includere qualsiasi attributo nel modello di dati. Di seguito sono riportati esempi di criteri espliciti che è possibile considerare nella propria strategia di gestione della casa:
- Le parti condividono lo stesso indirizzo di un determinato tipo di indirizzo, ad esempio lo stesso indirizzo di casa.
- Le parti condividono un cognome.
- Le parti rientrano in un intervallo di età definito.
- Le parti condividono un metodo di contatto, ad esempio un numero di telefono di casa.
- Le parti hanno un certo tipo di relazione, come una relazione familiare.
- Le parti hanno ruoli specifici nel contesto di un contratto. Ad esempio, un elemento principale potrebbe avere un ruolo di rappresentante legale per un account di proprietà di un elemento secondario.
Utilizzare criteri espliciti per creare nuclei familiari con l'algoritmo di corrispondenza. Per abilitare IBM Match 360 per creare le entità del nucleo familiare in modo algoritmico, selezionare i criteri espliciti selezionati come attributi corrispondenti per questo tipo di entità. Per informazioni sulla configurazione dell'algoritmo di corrispondenza, consultare Corrispondenza dei dati per creare entità di dati master.
Criteri espressi include altre informazioni che non fanno parte del modello dati. I criteri espressi potrebbero essere stati comunicati verbalmente da un membro del nucleo familiare o da un agente. I seguenti sono esempi di criteri espressi che è possibile considerare nella propria strategia di gestione delle case:
- Le parti hanno comunicato di essere all'interno della stessa famiglia.
- Un agente ha raccolto informazioni sul nucleo familiare durante la configurazione iniziale di un account cliente.
Per creare un'entità nucleo familiare basata su criteri espressi, è necessario collegare manualmente i record per formare un'entità. È possibile creare collegamenti manuali tra i record utilizzando l'area di lavoro dei dati anagrafici per modificare le regole di collegamento di un record. Per ulteriori informazioni, vedi Exploring master data entities and records in IBM Match 360 with Watson.
Determinazione dei valori di attributo di un'entità
Un'entità dati master può includere due categorie di attributi:
- Attributi i cui valori sono composti da record membro di un'entità.
- Attributi i cui valori sono memorizzati direttamente nell'entità, noti come attributi entità.
- Attributi composti
- Le entità ricavano molti dei loro valori di attributo dai valori definiti nei relativi record membro. I valori di attributo di un'entità vengono selezionati dai relativi record membro utilizzando una serie di regole di composizione attributo. È possibile definire e personalizzare le regole di composizione attributo per ciascun tipo di entità nel modello di dati. Per ulteriori informazioni sulla composizione degli attributi, consultare Definizione delle regole di composizione degli attributi in IBM Match 360.:
- Attributi entità
- Gli attributi di entit ... sono definiti direttamente nell'entit ..., invece di essere composti dai relativi record membro. Definire gli attributi dell'entità nel modello di dati dei tipi di entità. Per informazioni sulla modifica del modello dati, consultare Personalizzazione del modello dati.
- Per modificare il valore di un attributo di entità, modificare direttamente l'entità. La modifica dei record del membro non influisce sul valore di un'entità. Per informazioni sulla modifica di una entità, vedi Aggiunta e modifica di record ed entità in IBM Match 360.
- Quando un'entità viene creata per la prima volta dall'algoritmo di corrispondenza, non ha alcun valore di attributo di entità definito. Modificare l'entità nell'area di lavoro dei dati master per fornire i valori degli attributi dell'entità.
- Se un'entità con valori di attributo di entità popolati viene eliminata come risultato di una modifica nella sua composizione, tramite un'azione link o unlink manuale o tramite una modifica all'algoritmo corrispondente, i suoi valori di attributi di entità vengono trasferiti a qualsiasi entità sopravvissuta.
- Se due entità che hanno entrambi gli attributi di entità vengono unite (corrispondenti o collegate manualmente), i valori dell'attributo di entità dell'ID entità restante hanno la precedenza. Se l'attributo in questione è costituito da un elenco di valori, il sistema unisce gli elenchi da entrambe le entità. L'unione garantisce che l'elenco non contenga valori duplicati. Se i due elenchi includono entrambi lo stesso valore, tale valore viene visualizzato una sola volta nell'elenco unito.
Persistenza delle entità
Quando si definisce il modello di dati, si può configurare se le viste composite di ogni tipo di entità sono salvate nel database o se sono composte su richiesta dai loro record membri. Quando un tipo di entità è configurato per persistere, gli attributi composti di ogni entità vengono memorizzati nel database in modo simile a come vengono memorizzati gli attributi dei record, il che significa che i dati delle entità sono più stabili e resistenti.
Quando le entità sono configurate per persistere, i data steward e gli utenti aziendali possono effettuare ricerche dirette sui dati delle entità, compresi gli attributi supplementari, gli attributi di verifica e le proprietà del sistema, come il numero di record e l'ID dell'entità. Gli utenti possono cercare le entità persistenti utilizzando i meccanismi di ricerca semplici o avanzati dell'interfaccia di esplorazione dei dati master.
A seconda del volume delle entità nei dati master, la memorizzazione delle viste composite delle entità nel database può causare un aumento significativo delle dimensioni del database.
Per ulteriori informazioni sulla definizione dei tipi di entità, vedere Personalizzazione del modello di dati.
Il modello di dati IBM Match 360
Il Modello dati definisce i metadati associati ai dati caricati in IBM Match 360.
Il modello dati contiene proprietà e regole utilizzate in IBM Match 360 per identificare e categorizzare le informazioni presenti nei dati. Il modello di dati è costituito da diversi tipi di metadati:
È possibile definire tipi di record, tipi di attributi e tipi di relazione personalizzati in base ai requisiti dell'organizzazione. Le proprietà di sistema generalmente non possono essere personalizzate.
Proprietà di sistema (attributi di controllo)
Le proprietà di sistema nel modello di dati migliorano la possibilità di controllare i dati in IBM Match 360 per garantire la conformità con le regole di governance dei dati. Le proprietà di sistema sono definite, catturate e memorizzate dal sistema e non sono disponibili per la personalizzazione o la modifica. Esistono proprietà di sistema associate a quattro diversi elementi del modello di dati: tipi di record, tipi di entità, tipi di attributi e tipi di relazioni.
Le proprietà di sistema Tipo di record memorizzano le informazioni di sistema a livello record. Ad esempio:
record_last_updated
tiene traccia dell'ora dell'ultimo aggiornamento di ogni record.record_number
memorizza un numero identificativo generato dal sistema per ogni record.
Le proprietà di sistema Tipo entità memorizzano le informazioni di sistema a livello di entità. Ad esempio:
created_date
memorizza l'ora e la data in cui è stata creata un'entità.link_last_updated_date
tiene traccia dell'ora e della data in cui i record del membro di un'entità sono stati modificati l'ultima volta.last_updated_date
memorizza l'ora e la data dell'ultima modifica degli attributi supplementari di un'entità.last_updated_user
tiene traccia dell'utente che ha apportato le modifiche più recenti agli attributi supplementari di un'entità.
Le proprietà di sistema Tipo di attributo memorizzano le informazioni di sistema a livello di attributo. Ad esempio,
attribute_last_updated
traccia l'ora dell'ultimo aggiornamento di ogni attributo.Le proprietà di sistema Tipo di relazione memorizzano le informazioni di sistema a livello di relazione. Ad esempio:
relationship_last_updated
traccia l'ora dell'ultimo aggiornamento di ciascuna relazione.relationship_number
memorizza un numero identificativo generato dal sistema per ogni relazione.
Guarda il seguente video per scoprire come visualizzare gli attributi di controllo generati dal sistema creati da IBM Match 360 quando aggiungi o modifichi i dati del record.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Tipi di record
I tipi di record nel modello dati definiscono vari tipi di record relativi ai domini e ai casi di utilizzo richiesti dalla propria organizzazione. Ogni tipo di record è costituito dalle seguenti proprietà o oggetti:
label
è l'etichetta per il tipo di record.description
è una breve descrizione del tipo record.entity_types
contiene gli oggetti per tutti i tipi di entità inclusi in questo tipo di record. Ogni oggettoentity_type
contiene un'etichetta, una descrizione e, facoltativamente, un tipo di entità (identità o associazione).attributes
è un oggetto che contiene tutti gli attributi associati al tipo di record. Ogni attributo definito contiene le seguenti proprietà:label
- Un'etichetta per l'attributo.description
- Una descrizione dell'attributo.attribute_type
- Il tipo di attributo di questo attributo.cardinality
- La cardinalità dell'attributo (elenco o singolo). La cardinalità definisce il numero di valori che questo attributo può avere.indexed
- Un campo booleano che indica se l'attributo è indicizzato per supportare le ricerche di testo libero del suo contenuto.
Tipi di attributo
I tipi di attributi nel modello di dati definiscono i tipi di attributi che possono essere associati a un tipo di record o a un tipo di relazione. Ogni voce del tipo di attributo è composta dalle seguenti proprietà o oggetti:
label
è l'etichetta per il tipo di attributo.description
è una breve descrizione del tipo di attributo.matching_types
indica il tipo di funzione corrispondente da applicare a tutti gli attributi di questo tipo di attributo.fields
contiene definizioni di tutti i campi che fanno parte di questo tipo di attributo. Ogni campo è costituito da proprietàlabel
,description
eindexed
.
Tipi di relazione
I tipi di relazione nel modello dati definiscono i tipi di relazioni disponibili da assegnare in questi dati. Ogni tipo di relazione definito include le proprietà e gli oggetti seguenti:
label
è un'etichetta per il tipo di relazione.description
è una breve descrizione del tipo di relazione.label_from_source
è l'etichetta per la relazione, visualizzata dal punto di vista dell'origine. Ad esempio: "Manages".label_from_target
è l'etichetta per la relazione, come visualizzato dal punto di vista della destinazione. Ad esempio: "Riporta a".cardinality
definisce la cardinalità della relazione (ad esempio uno - a - molti o uno - a - uno).directional
indica se le relazioni di questo tipo sono direzionali (diverse a seconda del lato della relazione che si sta visualizzando, ad esempio una relazione medico / paziente) o bidirezionali (uguali da entrambi i lati della relazione, ad esempio una relazione peer).attributes
è un oggetto contenente le definizioni di tutti gli attributi che fanno parte di questo tipo di relazione. L'oggettoattributes
ha la stessa struttura di quella per un attributo di un tipo di record.rules
è un oggetto che definisce le regole di origine e di destinazione per questo tipo di relazione.- L'oggetto per una regola source contiene un elenco di tipi di record e di entità che è possibile utilizzare come origine durante la creazione di una relazione di questo tipo.
- L'oggetto per una regola destinazione contiene l'elenco di tipi di record e tipi di entità che è possibile utilizzare come destinazione durante la creazione di una relazione di questo tipo.
Ulteriori informazioni
- Algoritmi di corrispondenza
- Esercitazione Master Data Management : configurare una vista a 360 gradi
Argomento principale Gestione dei dati master