IBM Match 360 crée des entités de données maître en exécutant un algorithme de correspondance sur les enregistrements fournis par un ou plusieurs actifs de données. Les entités et les enregistrements sont définis et composés en fonction du modèle de données IBM Match 360 personnalisable.
Dans cette rubrique :
Enregistrements et entités
Chaque entité est un objet de données maître qui fournit une vue à 360 degrés d'une personne, d'une organisation ou d'une autre entité. Un ou plusieurs enregistrements de données peuvent contribuer à une entité unique.
Un enregistrement est un ensemble d'informations démographiques qui représente un point de vue unique d'une personne ou d'une organisation, issu d'une source de données unique. Si la même personne ou organisation figure dans plusieurs sources de données, tous les enregistrements correspondants sont reliés par l'algorithme de correspondance comme une seule entité. Les enregistrements sont constitués d'attributs et de valeurs de champ qui décrivent la personne ou l'organisation.
Une entité de données maître est une composition d'enregistrements qu' IBM Match 360 détermine comme devant être mis en correspondance. Votre modèle de données peut définir deux catégories d'entité: identité ou association. Chaque entité inclut un ou plusieurs enregistrements de membre que l'algorithme de correspondance a liés entre eux. IBM Match 360 détermine intelligemment l'ensemble le plus probable d'attributs et de valeurs de champs qui décrivent correctement l'entité représentée, et les fait apparaître dans la vue de l'espace de travail des données de base.
Un ou plusieurs enregistrements de membre peuvent contribuer à une vue d'entité. Les enregistrements de membre qui constituent une entité peuvent changer si l'algorithme de correspondance est exécuté à nouveau avec des paramètres différents, par exemple avec un seuil de liaison automatique différent ou un ensemble différent de sélections d'attributs de correspondance.
Une entité peut être constituée d'un seul enregistrement. Dans ce cas, l'entité est appelée singleton.
Chaque entité est générée autour d'un enregistrement central. L'enregistrement le plus ancien d'une entité est considéré comme l'enregistrement central. Les enregistrements de centre sont la base de l'entité et ne peuvent pas être dissociés ou déplacés vers une autre entité.
Chaque enregistrement qui contribue à une entité est représenté sous la forme d'une arête de graphique entre les enregistrements et l'entité, comme déterminé par le traitement de correspondance. Lorsque vous réexécutez l'algorithme de correspondance, les arêtes représentant les liens sont mises à jour.
Types d'entités
Lorsque vous définissez un nouveau type d'entité dans votre modèle de données, vous devez décider de l'objet de cette entité:
Les entités d' identité lient des enregistrements qui semblent tous représenter la même personne, la même organisation ou le même objet réel. Ils partagent une identité commune. Par exemple, une entité Partenaires commerciaux peut être utilisée pour faire correspondre des enregistrements d'organisation dans vos données qui représentent la même société réelle.
Les entités Association lient des enregistrements qui doivent être associés pour une autre raison, telle qu'une adresse partagée, un employeur ou une décision d'achat. Un exemple courant d'un type d'entité d'association est un foyer. Vous pouvez créer un type d'entité Foyers qui correspond aux membres d'un foyer donné dans une seule entité. En utilisant des entités de ménage, vous pouvez suivre et analyser le comportement et l'activité par foyer.
Entités de ménage
Regardez la vidéo suivante pour voir comment utiliser les entités d'association afin d'identifier les ménages dans vos données IBM Match 360 .
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Lorsque vous créez un type d'entité d'association pour vous aider à suivre et à identifier les enregistrements de personne qui partagent un foyer, il existe des facteurs importants à prendre en compte. L'établissement de vos critères de ménage est une première étape cruciale dans la gestion et la formation des ménages. Les ménages peuvent être définis par des critères explicites, des critères exprimés ou une combinaison des deux.
Les critères explicites peuvent inclure n'importe quel attribut dans votre modèle de données. Voici des exemples de critères explicites que vous pouvez prendre en compte dans votre stratégie de ménage:
- Les parties partagent la même adresse d'un type d'adresse donné, par exemple la même adresse personnelle.
- Les parties partagent un nom de famille.
- Les parties se situent dans une tranche d'âge définie.
- Les parties partagent une méthode de contact, telle qu'un numéro de téléphone personnel.
- Les parties ont un certain type de relation, comme une relation de famille.
- Les parties ont des rôles spécifiques dans le contexte d'un contrat. Par exemple, un parent peut avoir un rôle de représentant légal pour un compte appartenant à un enfant.
Utilisez des critères explicites pour créer des ménages avec l'algorithme de correspondance. Pour permettre à IBM Match 360 de générer vos entités de foyer de manière algorithmique, sélectionnez les critères explicites que vous avez sélectionnés comme attributs de correspondance pour ce type d'entité. Pour plus d'informations sur la configuration de l'algorithme de correspondance, voir Mise en correspondance de vos données pour créer des entités de données maître.
Critères exprimés inclut d'autres informations qui ne font pas partie du modèle de données. Les critères exprimés peuvent avoir été communiqués verbalement par un membre du ménage ou un agent. Voici des exemples de critères exprimés que vous pouvez prendre en compte dans votre stratégie d'entretien ménager:
- Les parties ont fait savoir qu'elles font partie du même ménage.
- Un agent a collecté des informations sur le foyer lors de la configuration initiale d'un compte client.
Pour générer une entité de foyer basée sur des critères exprimés, vous devez lier manuellement des enregistrements pour former une entité. Vous pouvez créer des liens manuels entre enregistrements en utilisant l'espace de travail des données de base pour modifier les règles de lien d'un enregistrement. Pour plus d'informations, voir Exploration des entités et des enregistrements de données maître dans IBM Match 360 with Watson.
Détermination des valeurs d'attribut d'une entité
Une entité de données maître peut inclure deux catégories d'attributs:
- Attributs dont les valeurs sont composées à partir des enregistrements de membre d'une entité.
- Attributs dont les valeurs sont stockées directement dans l'entité, appelés attributs d'entité.
- Attributs composites
- Les entités dérivent un grand nombre de leurs valeurs d'attribut à partir des valeurs définies dans leurs enregistrements de membre. Les valeurs d'attribut d'une entité sont sélectionnées à partir de ses enregistrements de membre à l'aide d'un ensemble de règles de composition d'attribut. Vous pouvez définir et personnaliser des règles de composition d'attribut pour chaque type d'entité dans votre modèle de données. Pour plus d'informations sur la composition des attributs, voir Définition des règles de composition des attributs dans IBM Match 360.
- Attributs d'entité
- Les attributs d'entité sont définis directement dans l'entité, au lieu d'être composés à partir de ses enregistrements de membre. Définissez des attributs d'entité dans le modèle de données de vos types d'entité. Pour plus d'informations sur la modification du modèle de données, voir Personnalisation de votre modèle de données.
- Pour modifier la valeur d'un attribut d'entité, éditez l'entité directement. L'édition des enregistrements de membre n'affecte pas la valeur d'un attribut d'entité. Pour plus d'informations sur l'édition d'une entité, voir Ajout et édition d'enregistrements et d'entités dans IBM Match 360.
- Lorsqu'une entité est créée pour la première fois par l'algorithme de correspondance, aucune valeur d'attribut d'entité n'est définie. Modifiez l'entité dans l'espace de travail des données de base afin de fournir des valeurs pour les attributs de l'entité.
- Si une entité avec des valeurs d'attribut d'entité remplies est supprimée suite à une modification de sa composition, via une action link ou unlink manuelle ou via une modification de l'algorithme de correspondance, ses valeurs d'attribut d'entité sont transférées à toutes les entités survivantes.
- Si deux entités qui possèdent toutes deux des attributs d'entité sont fusionnées (appariées ou liées manuellement), les valeurs d'attribut d'entité de l'ID d'entité survivant sont prioritaires. Si l'attribut en question consiste en une liste de valeurs, le système fusionne les listes des deux entités. La fusion garantit que la liste ne contient pas de valeurs en double. Si les deux listes contiennent la même valeur, cette valeur n'apparaît qu'une seule fois dans la liste fusionnée.
Persistance des entités
Lors de la définition du modèle de données, vous pouvez déterminer si les vues composites de chaque type d'entité sont sauvegardées dans la base de données ou composées à la demande à partir de leurs enregistrements membres. Lorsqu'un type d'entité est configuré pour persister, les attributs composés de chaque entité sont stockés dans la base de données de la même manière que les attributs des enregistrements, ce qui signifie que les données des entités sont plus stables et plus résistantes.
Lorsque les entités sont configurées pour persister, les gestionnaires de données et les utilisateurs professionnels peuvent directement effectuer des recherches sur les données de l'entité, y compris les attributs supplémentaires, les attributs d'audit et les propriétés du système telles que le nombre d'enregistrements et l'identifiant de l'entité. Les utilisateurs peuvent rechercher des entités persistantes en utilisant les mécanismes de recherche simple ou avancée dans l'interface de l'explorateur de données de base.
En fonction du volume d'entités dans vos données de base, le stockage des vues composites d'entités dans la base de données peut entraîner une augmentation significative de la taille de la base de données.
Pour plus d'informations sur la définition des types d'entités, voir Personnaliser le modèle de données.
Le modèle de données IBM Match 360
Le modèle de données définit les métadonnées associées aux données chargées dans IBM Match 360.
Le modèle de données contient des propriétés et des règles qui sont utilisées dans IBM Match 360 pour identifier et catégoriser les informations présentes dans les données. Le modèle de données comprend différents types de métadonnées:
Vous pouvez définir vos propres types d'enregistrement, types d'attribut et types de relation en fonction des exigences de votre organisation. Les propriétés système ne peuvent généralement pas être personnalisées.
Propriétés système (attributs d'audit)
Les propriétés système du modèle de données améliorent votre capacité à auditer les données dans IBM Match 360 afin de garantir la conformité avec les règles de gouvernance des données. Les propriétés système sont définies, capturées et stockées par le système et ne sont pas disponibles pour la personnalisation ou la modification. Des propriétés système sont associées à quatre éléments différents du modèle de données: types d'enregistrement, types d'entité, types d'attribut et types de relation.
Les propriétés système Type d'enregistrement stockent les informations système au niveau de l'enregistrement. Par exemple :
record_last_updated
suit l'heure à laquelle chaque enregistrement a été mis à jour pour la dernière fois.record_number
stocke un numéro d'identification généré par le système pour chaque enregistrement.
Les propriétés système Type d'entité stockent les informations système au niveau de l'entité. Par exemple :
created_date
stocke l'heure et la date de création d'une entité.link_last_updated_date
suit l'heure et la date de la dernière modification des enregistrements de membre d'une entité.last_updated_date
stocke l'heure et la date de la dernière modification des attributs supplémentaires d'une entité.last_updated_user
suit l'utilisateur qui a apporté les modifications les plus récentes aux attributs supplémentaires d'une entité.
Les propriétés système Type d'attribut stockent les informations système au niveau de l'attribut. Par exemple,
attribute_last_updated
suit l'heure à laquelle chaque attribut a été mis à jour pour la dernière fois.Les propriétés système Type de relation stockent les informations système au niveau de la relation. Par exemple :
relationship_last_updated
suit l'heure à laquelle chaque relation a été mise à jour pour la dernière fois.relationship_number
stocke un numéro d'identification généré par le système pour chaque relation.
Regardez la vidéo suivante pour voir comment afficher les attributs d'audit générés par le système et créés par IBM Match 360 lorsque vous ajoutez ou éditez des données d'enregistrement.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
Types d'enregistrement
Les types d'enregistrement du modèle de données définissent différents types d'enregistrement pertinents pour les domaines et les cas d'utilisation requis par votre organisation. Chaque type d'enregistrement comprend les propriétés ou objets suivants:
label
est le libellé du type d'enregistrement.description
est une brève description du type d'enregistrement.entity_types
contient les objets de tous les types d'entité inclus dans ce type d'enregistrement. Chaque objetentity_type
contient un libellé, une description et éventuellement un type d'entité (identité ou association).attributes
est un objet qui contient tous les attributs associés au type d'enregistrement. Chaque attribut défini contient les propriétés suivantes:label
-Libellé de l'attribut.description
-Description de l'attribut.attribute_type
-Type d'attribut de cet attribut.cardinality
-cardinalité de l'attribut (liste ou unique). La cardinalité définit le nombre de valeurs que cet attribut peut avoir.indexed
-Zone booléenne indiquant si l'attribut est indexé pour prendre en charge les recherches de texte libre de son contenu.
Types d'attribut
Les types d'attribut dans le modèle de données définissent les types d'attribut qui peuvent être associés à un type d'enregistrement ou à un type de relation. Chaque entrée de type d'attribut se compose des propriétés ou des objets suivants:
label
est le libellé du type d'attribut.description
est une brève description du type d'attribut.matching_types
indique le type de fonction de correspondance à appliquer à tous les attributs de ce type d'attribut.fields
contient les définitions de toutes les zones qui font partie de ce type d'attribut. Chaque zone se compose des propriétéslabel
,description
etindexed
.
Types de relation
Les types de relation dans le modèle de données définissent les types de relations pouvant être affectés dans ces données. Chaque type de relation défini inclut les propriétés et objets suivants:
label
est un libellé pour le type de relation.description
est une brève description du type de relation.label_from_source
est le libellé de la relation, tel qu'il apparaît du point de vue de la source. Par exemple: "Manages".label_from_target
est le libellé de la relation, tel qu'il apparaît du point de vue de la cible. Par exemple: "Reports to".cardinality
définit la cardinalité de la relation (par exemple, un à plusieurs ou un à un).directional
indique si les relations de ce type sont directionnelles (différentes selon le côté de la relation que vous visualisez, par exemple une relation médecin / patient) ou bidirectionnelles (identiques des deux côtés de la relation, par exemple une relation homologue).attributes
est un objet contenant les définitions de tous les attributs qui font partie de ce type de relation. L'objetattributes
a la même structure que celle d'un attribut d'un type d'enregistrement.rules
est un objet qui définit les règles source et cible pour ce type de relation.- L'objet d'une règle source contient la liste des types d'enregistrement et des types d'entité qui peuvent être utilisés comme source lors de la création d'une relation de ce type.
- L'objet d'une règle target contient la liste des types d'enregistrement et des types d'entité qui peuvent être utilisés comme cible lors de la création d'une relation de ce type.
En savoir plus
Rubrique parent : Gestion des données maître