Concepts de données dans IBM Match 360 as a Service
IBM Match 360 crée des entités de données maître en exécutant un algorithme de correspondance sur les enregistrements fournis par un ou plusieurs actifs de données. Les entités et les enregistrements sont définis et composés sur la base des types de données personnalisables IBM Match 360.
Dans cette rubrique :
Enregistrements et entités
Chaque entité est un objet de données maître qui fournit une vue à 360 degrés d'une personne, d'une organisation ou d'une autre entité. Un ou plusieurs enregistrements de données peuvent contribuer à une entité unique.
Un enregistrement est un ensemble d'informations démographiques qui représente un point de vue unique d'une personne ou d'une organisation, issu d'une source de données unique. Si la même personne ou organisation figure dans plusieurs sources de données, tous les enregistrements correspondants sont reliés par l'algorithme de correspondance comme une seule entité. Les enregistrements sont constitués d'attributs et de valeurs de champ qui décrivent la personne ou l'organisation.
Une entité de données maître est une composition d'enregistrements qu' IBM Match 360 détermine comme devant être mis en correspondance. Vos définitions de types de données peuvent définir deux catégories d'entités : l'identité ou l'association. Chaque entité inclut un ou plusieurs enregistrements de membre que l'algorithme de correspondance a liés entre eux. IBM Match 360 détermine intelligemment l'ensemble le plus probable d'attributs et de valeurs de champs qui décrivent correctement l'entité représentée, et les fait apparaître dans la vue de l'espace de travail des données de base.
Un ou plusieurs enregistrements de membre peuvent contribuer à une vue d'entité. Les enregistrements de membre qui constituent une entité peuvent changer si l'algorithme de correspondance est exécuté à nouveau avec des paramètres différents, par exemple avec un seuil de liaison automatique différent ou un ensemble différent de sélections d'attributs de correspondance.
Une entité peut être constituée d'un seul enregistrement. Dans ce cas, l'entité est appelée singleton.
Chaque entité est générée autour d'un enregistrement central. L'enregistrement le plus ancien d'une entité est considéré comme l'enregistrement central. Les enregistrements de centre sont la base de l'entité et ne peuvent pas être dissociés ou déplacés vers une autre entité.
Chaque enregistrement qui contribue à une entité est représenté sous la forme d'une arête de graphique entre les enregistrements et l'entité, comme déterminé par le traitement de correspondance. Lorsque vous réexécutez l'algorithme de correspondance, les arêtes représentant les liens sont mises à jour.
Types d'entités
Lorsque vous définissez un nouveau type d'entité dans vos définitions de types de données, vous devez décider de l'objectif de cette entité :
Les entités d' identité lient des enregistrements qui semblent tous représenter la même personne, la même organisation ou le même objet réel. Ils partagent une identité commune. Par exemple, une entité Partenaires commerciaux peut être utilisée pour faire correspondre des enregistrements d'organisation dans vos données qui représentent la même société réelle.
Les entités Association lient des enregistrements qui doivent être associés pour une autre raison, telle qu'une adresse partagée, un employeur ou une décision d'achat. Un exemple courant d'un type d'entité d'association est un foyer. Vous pouvez créer un type d'entité Foyers qui correspond aux membres d'un foyer donné dans une seule entité. En utilisant des entités de ménage, vous pouvez suivre et analyser le comportement et l'activité par foyer.
Entités de ménage
Regardez la vidéo suivante pour voir comment utiliser les entités d'association afin d'identifier les ménages dans vos données IBM Match 360 .
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Lorsque vous créez un type d'entité d'association pour vous aider à suivre et à identifier les enregistrements de personne qui partagent un foyer, il existe des facteurs importants à prendre en compte. L'établissement de vos critères de ménage est une première étape cruciale dans la gestion et la formation des ménages. Les ménages peuvent être définis par des critères explicites, des critères exprimés ou une combinaison des deux.
Les critères explicites peuvent inclure n'importe quel attribut défini dans vos types de données. Voici des exemples de critères explicites que vous pouvez prendre en compte dans votre stratégie de ménage:
- Les parties partagent la même adresse d'un type d'adresse donné, par exemple la même adresse personnelle.
- Les parties partagent un nom de famille.
- Les parties se situent dans une tranche d'âge définie.
- Les parties partagent une méthode de contact, telle qu'un numéro de téléphone personnel.
- Les parties ont un certain type de relation, comme une relation de famille.
- Les parties ont des rôles spécifiques dans le contexte d'un contrat. Par exemple, un parent peut avoir un rôle de représentant légal pour un compte appartenant à un enfant.
Utilisez des critères explicites pour créer des ménages avec l'algorithme de correspondance. Pour permettre à IBM Match 360 de générer vos entités de foyer de manière algorithmique, sélectionnez les critères explicites que vous avez sélectionnés comme attributs de correspondance pour ce type d'entité. Pour plus d'informations sur la configuration de l'algorithme de correspondance, voir Mise en correspondance de vos données pour créer des entités de données maître.
Critères exprimés inclut d'autres informations qui ne font pas partie du modèle de données. Les critères exprimés peuvent avoir été communiqués verbalement par un membre du ménage ou un agent. Voici des exemples de critères exprimés que vous pouvez prendre en compte dans votre stratégie d'entretien ménager:
- Les parties ont fait savoir qu'elles font partie du même ménage.
- Un agent a collecté des informations sur le foyer lors de la configuration initiale d'un compte client.
Pour générer une entité de foyer basée sur des critères exprimés, vous devez lier manuellement des enregistrements pour former une entité. Vous pouvez créer des liens manuels entre enregistrements en utilisant l'espace de travail des données de base pour modifier les règles de lien d'un enregistrement. Pour plus d'informations, voir Exploration des entités et des enregistrements de données de base sur IBM Match 360 as a Service.
Détermination des valeurs d'attribut d'une entité
Une entité de données maître peut inclure deux catégories d'attributs:
- Attributs dont les valeurs sont composées à partir des enregistrements de membre d'une entité.
- Attributs dont les valeurs sont stockées directement dans l'entité, appelés attributs d'entité.
- Attributs composites
- Les entités dérivent un grand nombre de leurs valeurs d'attribut à partir des valeurs définies dans leurs enregistrements de membre. Les valeurs d'attribut d'une entité sont sélectionnées à partir de ses enregistrements de membre à l'aide d'un ensemble de règles de composition d'attribut. Vous pouvez définir et personnaliser les règles de composition des attributs pour chaque type d'entité dans les définitions des types de données. Pour plus d'informations sur la composition des attributs, voir Définition des règles de composition des attributs dans IBM Match 360.
- Attributs d'entité
- Les attributs d'entité sont définis directement dans l'entité, au lieu d'être composés à partir de ses enregistrements de membre. Définissez les attributs de l'entité dans la définition du type de données pour vos types d'entités. Pour plus d'informations sur la modification des types de données, voir Personnalisation des types de données.
- Pour modifier la valeur d'un attribut d'entité, éditez l'entité directement. L'édition des enregistrements de membre n'affecte pas la valeur d'un attribut d'entité. Pour plus d'informations sur l'édition d'une entité, voir Ajout et édition d'enregistrements et d'entités dans IBM Match 360.
- Lorsqu'une entité est créée pour la première fois par l'algorithme de correspondance, aucune valeur d'attribut d'entité n'est définie. Modifiez l'entité dans l'espace de travail des données de base afin de fournir des valeurs pour les attributs de l'entité.
- Si une entité avec des valeurs d'attribut d'entité remplies est supprimée suite à une modification de sa composition, via une action link ou unlink manuelle ou via une modification de l'algorithme de correspondance, ses valeurs d'attribut d'entité sont transférées à toutes les entités survivantes.
- Si deux entités qui possèdent toutes deux des attributs d'entité sont fusionnées (appariées ou liées manuellement), les valeurs d'attribut d'entité de l'ID d'entité survivant sont prioritaires. Si l'attribut en question consiste en une liste de valeurs, le système fusionne les listes des deux entités. La fusion garantit que la liste ne contient pas de valeurs en double. Si les deux listes contiennent la même valeur, cette valeur n'apparaît qu'une seule fois dans la liste fusionnée.
Persistance des entités
Lors de la définition des types de données, vous pouvez déterminer si les vues composites de chaque type d'entité sont sauvegardées dans la base de données ou composées à la demande à partir de leurs enregistrements membres. Lorsqu'un type d'entité est configuré pour persister, les attributs composés de chaque entité sont stockés dans la base de données de la même manière que les attributs des enregistrements, ce qui signifie que les données des entités sont plus stables et plus résistantes.
Lorsque les entités sont configurées pour persister, les gestionnaires de données et les utilisateurs professionnels peuvent directement effectuer des recherches sur les données de l'entité, y compris les attributs supplémentaires, les attributs d'audit et les propriétés du système telles que le nombre d'enregistrements et l'identifiant de l'entité. Les utilisateurs peuvent rechercher des entités persistantes en utilisant les mécanismes de recherche simple ou avancée dans l'interface de l'explorateur de données de base.
En fonction du volume d'entités dans vos données de base, le stockage des vues composites d'entités dans la base de données peut entraîner une augmentation significative de la taille de la base de données.
Pour plus d'informations sur la définition des types d'entités, voir Personnalisation des types de données.
Le modèle de données IBM Match 360
Vos définitions de type de données, également appelées modèle de données, décrivent les métadonnées associées aux données chargées dans IBM Match 360.
Le modèle de données contient des propriétés et des règles qui sont utilisées dans IBM Match 360 pour identifier et catégoriser les informations présentes dans les données. Le modèle de données comprend différents types de métadonnées:
- Propriétés système (attributs d'audit)
- Types d´enregistrement
- Types d'attribut
- Types de relation
- Types de hiérarchie
- Types de noeud
- Types de groupe
Vous pouvez définir vos propres types d'enregistrements, types d'attributs, types de relations, etc. pour répondre aux exigences du modèle de données de votre organisation. Les propriétés système ne peuvent généralement pas être personnalisées.
Propriétés système (attributs d'audit)
Les propriétés système du modèle de données améliorent votre capacité à auditer les données dans IBM Match 360 afin de garantir la conformité avec les règles de gouvernance des données. Les propriétés système sont définies, capturées et stockées par le système et ne sont pas disponibles pour la personnalisation ou la modification.
Des propriétés système sont associées à différents éléments du modèle de données : types d'enregistrements, types d'entités, types d'attributs, types de relations, types de hiérarchies, types de nœuds et types de groupes.
Les propriétés système Type d'enregistrement stockent les informations système au niveau de l'enregistrement. Par exemple :
record_last_updated
suit l'heure à laquelle chaque enregistrement a été mis à jour pour la dernière fois.record_number
stocke un numéro d'identification généré par le système pour chaque enregistrement.
Les propriétés système Type d'entité stockent les informations système au niveau de l'entité. Par exemple :
created_date
stocke l'heure et la date de création d'une entité.link_last_updated_date
suit l'heure et la date de la dernière modification des enregistrements de membre d'une entité.last_updated_date
stocke l'heure et la date de la dernière modification des attributs supplémentaires d'une entité.last_updated_user
suit l'utilisateur qui a apporté les modifications les plus récentes aux attributs supplémentaires d'une entité.
Les propriétés système Type d'attribut stockent les informations système au niveau de l'attribut. Par exemple,
attribute_last_updated
suit l'heure à laquelle chaque attribut a été mis à jour pour la dernière fois.Les propriétés système Type de relation stockent les informations système au niveau de la relation. Par exemple :
relationship_last_updated
suit l'heure à laquelle chaque relation a été mise à jour pour la dernière fois.relationship_number
stocke un numéro d'identification généré par le système pour chaque relation.
Les propriétés de système de type hiérarchique stockent des informations sur le système au niveau de la hiérarchie. Par exemple :
last_updated_date
suit l'heure à laquelle chaque hiérarchie a été mise à jour pour la dernière fois.hierarchy_number
stocke un numéro d'identification généré par le système pour chaque hiérarchie.
Les propriétés du système de type nœud stockent des informations sur le système au niveau du nœud. Par exemple :
last_updated_date
suit l'heure de la dernière mise à jour de chaque nœud.node_number
stocke un numéro d'identification généré par le système pour chaque nœud.
Les propriétés du système de type groupe permettent de stocker des informations sur le système au niveau du groupe. Par exemple :
last_updated_date
suit l'heure à laquelle chaque groupe a été mis à jour pour la dernière fois.node_number
stocke un numéro d'identification généré par le système pour chaque instance de groupe.
Regardez la vidéo suivante pour voir comment afficher les attributs d'audit générés par le système et créés par IBM Match 360 lorsque vous ajoutez ou éditez des données d'enregistrement.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Types d'enregistrement
Les types d'enregistrement du modèle de données définissent différents types d'enregistrement pertinents pour les domaines et les cas d'utilisation requis par votre organisation. Chaque type d'enregistrement comprend les propriétés ou objets suivants:
label
est le libellé du type d'enregistrement.description
est une brève description du type d'enregistrement.entity_types
contient les objets de tous les types d'entité inclus dans ce type d'enregistrement. Chaque objetentity_type
contient un libellé, une description et éventuellement un type d'entité (identité ou association).attributes
est un objet qui contient tous les attributs associés au type d'enregistrement. Chaque attribut défini contient les propriétés suivantes:label
-Libellé de l'attribut.description
-Description de l'attribut.attribute_type
-Type d'attribut de cet attribut.cardinality
-cardinalité de l'attribut (liste ou unique). La cardinalité définit le nombre de valeurs que cet attribut peut avoir.indexed
-Zone booléenne indiquant si l'attribut est indexé pour prendre en charge les recherches de texte libre de son contenu.
Types d'attribut
Les types d'attribut dans le modèle de données définissent les types d'attribut qui peuvent être associés à un type d'enregistrement ou à un type de relation. Chaque entrée de type d'attribut se compose des propriétés ou des objets suivants:
label
est le libellé du type d'attribut.description
est une brève description du type d'attribut.matching_types
indique le type de fonction de correspondance à appliquer à tous les attributs de ce type d'attribut.fields
contient les définitions de toutes les zones qui font partie de ce type d'attribut. Chaque zone se compose des propriétéslabel
,description
etindexed
.
Types de relation
Les types de relation dans le modèle de données définissent les types de relations pouvant être affectés dans ces données. Chaque type de relation défini inclut les propriétés et objets suivants:
label
est un libellé pour le type de relation.description
est une brève description du type de relation.classification
spécifie la classe de la relation. Par exemple, les relations de type hiérarchique peuvent être classées comme suit :hierarchy_node_relationship
, qui est une relation de nœud à nœud de la hiérarchie, ouhierarchy_node_association_relationship
, qui est une relation entre un nœud de la hiérarchie et un objet associé. Les objets associés peuvent être des types d'enregistrements ou des types d'entités. De même, les relations de type groupe peuvent être classées dans la catégoriegroup_association_relationship
, qui est une relation de groupe à objet associé.label_from_source
est le libellé de la relation, tel qu'il apparaît du point de vue de la source. Par exemple: "Manages".label_from_target
est le libellé de la relation, tel qu'il apparaît du point de vue de la cible. Par exemple: "Reports to".cardinality
définit la cardinalité de la relation (par exemple, un à plusieurs ou un à un).directional
indique si les relations de ce type sont directionnelles (différentes selon le côté de la relation que vous visualisez, par exemple une relation médecin / patient) ou bidirectionnelles (identiques des deux côtés de la relation, par exemple une relation homologue).attributes
est un objet contenant les définitions de tous les attributs qui font partie de ce type de relation. L'objetattributes
a la même structure que celle d'un attribut d'un type d'enregistrement.rules
est un objet qui définit les règles source et cible pour ce type de relation.- L'objet d'une règle source contient la liste des types d'enregistrement et des types d'entité qui peuvent être utilisés comme source lors de la création d'une relation de ce type.
- L'objet d'une règle target contient la liste des types d'enregistrement et des types d'entité qui peuvent être utilisés comme cible lors de la création d'une relation de ce type.
Types de hiérarchie
Les types de hiérarchie dans le modèle de données définissent les types de hiérarchies disponibles pour être affectées dans ces données. Chaque type de hiérarchie défini comprend les propriétés et objets suivants :
label
est une étiquette pour le type de hiérarchie.description
est une brève description du type de hiérarchie.node_type
spécifie le type de nœud utilisé dans ce type de hiérarchie.node_relationship_type
spécifie le type de relation nœud à nœud utilisé dans ce type de hiérarchie.node_associations
spécifie la relation entre le nœud et les objets associés dans ce type de hiérarchie. Les objets associés peuvent être des types d'enregistrements ou des types d'entités.attributes
est un objet qui contient tous les attributs associés au type de hiérarchie. Chaque attribut défini contient les propriétés suivantes:label
est une étiquette pour l'attribut.description
est une description de l'attribut.attribute_type
est le type d'attribut de cet attribut.cardinality
est la cardinalité de l'attribut (liste ou simple). La cardinalité définit le nombre de valeurs que cet attribut peut avoir.indexed
est un champ booléen indiquant si l'attribut est indexé pour permettre des recherches en texte libre sur son contenu.
Types de noeud
Les types de nœuds dans le modèle de données définissent les types de nœuds disponibles pour être affectés dans ces données. Chaque type de nœud défini comprend les propriétés et objets suivants :
label
est une étiquette pour le type de nœud.description
est une brève description du type de nœud.classification
spécifie la classe du nœud. Par exemple, pour les hiérarchies, les nœuds sont classés commehierarchy_node
, ce qui signifie que le nœud est utilisé avec des types de hiérarchie.attributes
est un objet qui contient tous les attributs associés au type de nœud. Chaque attribut défini contient les propriétés suivantes:label
est une étiquette pour l'attribut.description
est une description de l'attribut.attribute_type
est le type d'attribut de cet attribut.cardinality
est la cardinalité de l'attribut (liste ou simple). La cardinalité définit le nombre de valeurs que cet attribut peut avoir.indexed
est un champ booléen indiquant si l'attribut est indexé pour permettre des recherches en texte libre sur son contenu.
Types de groupe
Les types de groupes dans le modèle de données définissent les types de groupes disponibles pour être affectés dans ces données. Chaque type de groupe défini comprend les propriétés et objets suivants :
label
est une étiquette pour le type de groupe.description
est une brève description du type de groupe.group_associations
spécifie la relation entre le groupe et les objets associés dans ce type de groupe. Les objets associés peuvent être des types d'enregistrements.attributes
est un objet qui contient tous les attributs associés au type de groupe. Chaque attribut défini contient les propriétés suivantes:label
est une étiquette pour l'attribut.description
est une description de l'attribut.attribute_type
est le type d'attribut de cet attribut.cardinality
est la cardinalité de l'attribut (liste ou simple). La cardinalité définit le nombre de valeurs que cet attribut peut avoir.indexed
est un champ booléen indiquant si l'attribut est indexé pour permettre des recherches en texte libre sur son contenu.
En savoir plus
Rubrique parent : Gestion des données maître