Passez en revue et évaluez les correspondances d'enregistrement potentielles dans vos données d'entité. Prenez des décisions de liaison ou de suppression de liaison pour améliorer la qualité des données et augmenter la confiance dans les données de votre entité.
Utilisez les capacités de qualité des données de IBM Cloud Pak for Data et le service IBM Match 360 pour identifier, comprendre, faire remonter, corriger et prévenir les problèmes de qualité des données au sein de vos données d'entité.
Dans cette rubrique :
- Avant de commencer
- Affichage de la qualité des données d'actif et du niveau de fiabilité de l'entité
- Génération de tâches pour les problèmes de correspondance potentiels
- Exécution de tâches pour résoudre des correspondances potentielles
Avant de commencer
Avant de pouvoir commencer à générer des tâches de correspondance potentielle et à les résoudre, un ingénieur en traitement de données doit avoir effectué les tâches suivantes:
- Activez la plage de révision administrative et configurez les seuils de révision administrative et de liaison automatique. Pour plus d'information, voir Personnalisation et renforcement de votre algorithme de correspondance.
- Configurez et activez le flux de travaux des correspondances potentielles pour cette instance de service. Pour plus d'informations, voir Configuration des flux de travaux IBM Match 360.
Affichage de la qualité des données d'actif et de la fiabilité des entités
Les propriétaires de projet et les collaborateurs peuvent afficher des informations sur la qualité des données pour leurs actifs de données. Les informations sur la qualité des données sont récapitulées dans une série de scores de dimension auxquels vous pouvez accéder à partir de l'onglet Qualité des données d'actif de votre projet.
L'une des dimensions qui contribue à l'évaluation de la qualité des données est la fiabilité de l'entité. La dimension de confiance d'entité est uniquement signalée pour les actifs de données d'entité IBM Match 360 connectés. La cote de confiance d'entité représente le pourcentage d'entités de données maître dans le système pour lesquelles IBM Match 360 est convaincu qu'elles sont correctes et complètes.
Vous pouvez améliorer la cote de confiance de l'entité d'un actif en optimisant votre algorithme de correspondance ou en remédiant aux problèmes de correspondance potentiels.
Pour plus d'informations sur la qualité des données, voir Informations sur la qualité des données pour les actifs de données.
Si la cote de confiance de l'entité de votre actif est faible, vos données peuvent bénéficier de la génération et de la résolution de certaines tâches de correspondances potentielles.
Pour afficher les informations sur la qualité des données et la cote de confiance de l'entité, procédez comme suit:
- Dans le menu de navigation Cloud Pak for Data , sélectionnez Projets > Tous les projets. Dans la page Projets, sélectionnez votre projet IBM Match 360 .
- Cliquez sur l'onglet Actifs du projet, puis sélectionnez l'actif de données maître connecté pour lequel vous souhaitez afficher l'analyse de la qualité des données.
- Sélectionnez l'onglet Qualité de données . La génération et l'affichage du rapport sur la qualité des données peut prendre un certain temps.
- Lorsque le rapport sur la qualité des données est disponible, examinez la cote de confiance de l'entité.
Génération de tâches pour les problèmes de correspondance potentiels
Avant de pouvoir passer en revue et résoudre les problèmes potentiels dans les entités correspondantes de vos données, vous devez générer des tâches de correspondance potentielles. Vous pouvez générer des tâches à partir de l'ensemble de données complet ou à partir d'un ensemble de résultats de recherche pour limiter la portée des tâches. Par exemple, vous pouvez choisir de concentrer vos tâches de résolution sur une certaine région géographique afin d'éviter de surcharger les boîtes de réception des tâches de vos intendants de données.
- Autorisations requises
- Pour créer et résoudre des tâches de correspondance potentielle, vous devez être membre du groupe d'utilisateurs de l'ingénieur en traitement de données ou de l'intendant de données pour le service IBM Match 360 .
Pour générer des tâches de résolution de correspondance potentielles:
Dans le menu de navigation Données de base, cliquez sur Recherche ' pour ouvrir la page de recherche des données de base.
Vous pouvez éventuellement exécuter une recherche pour limiter la portée de vos données. Pour plus d'informations sur la recherche, voir Exploration des entités et des enregistrements de données maître dans IBM Match 360.
Cliquez sur Créer des tâches.
Définissez les paramètres de la création de la tâche de résolution.
- Indiquez si vous souhaitez créer des tâches pour toutes les données ou les résultats de votre recherche en cours (le cas échéant).
- Sélectionnez les types d'entités à inclure dans ces tâches.
- Définissez le nombre de tâches que vous souhaitez créer au cours de cette action.
Cliquez sur Créer des tâches pour commencer à générer les tâches de résolution.
Lorsque les tâches sont prêtes, elles apparaissent comme des tâches Résoudre les correspondances potentielles dans les boîtes de réception des tâches des utilisateurs affectés. Les affectations d'utilisateur sont définies dans la configuration de flux de travaux.
Si une entité incluse dans une tâche Résoudre les correspondances potentielles générée est mise à jour, manuellement ou via le processus de mise en correspondance, Cloud Pak for Data invalide et supprime automatiquement la tâche correspondante. S'il existe encore des problèmes de correspondance potentiels après la mise à jour de la mise en correspondance, vous pouvez recréer des tâches en répétant la procédure de génération de tâche.
Exécution de tâches pour résoudre les correspondances potentielles
En tant qu'utilisateur de l'intendant de données, lorsque vous rencontrez des problèmes de correspondance potentiels dans votre boîte de réception des tâches, vous pouvez les réclamer et résoudre les problèmes de qualité de données identifiés.
Pour résoudre les problèmes de correspondance potentiels:
Dans le menu de navigation Cloud Pak for Data , sélectionnez Gouvernance > Boîte de réception des tâches. Votre boîte de réception des tâches s'ouvre pour afficher les tâches que vous avez affectées ou terminées.
Vérifiez si vous avez des tâches Résoudre les correspondances potentielles dans votre boîte de réception.
Cliquez sur l'icône de filtre " pour accéder aux options de filtre que vous pouvez utiliser pour réduire la portée de votre boîte de réception. Par exemple, pour afficher uniquement les tâches de résolution: sous Type de tâche, sélectionnez Résolution, puis cliquez sur Appliquer. Vous pouvez également trier votre boîte de réception des tâches par date d'échéance ou par date d'affectation.
Pour commencer à travailler sur une tâche, ouvrez-la et cliquez sur Réserver la tâche. Lorsque vous réclamez une tâche, le système l'empêche d'être utilisé par d'autres utilisateurs.
Passez en revue les détails récapitulatifs de la tâche.
Cliquez sur Résolution des problèmes pour commencer à comparer les enregistrements identifiés par la tâche. Une vue graphique s'ouvre pour vous montrer une représentation visuelle de tous les enregistrements et entités impliqués dans cette tâche de correspondance potentielle. Les correspondances potentielles entre les enregistrements sont représentées par des lignes en pointillés.
Si vous le souhaitez, cliquez sur chaque enregistrement pour afficher ses détails.
Dans le panneau des correspondances potentielles, vous verrez un élément pour chaque décision de correspondance potentielle incluse dans cette tâche. Cliquez sur chaque élément pour consulter les détails. Une comparaison côte à côte des enregistrements concernés vous sera présentée pour vous aider à prendre votre décision.
Si vous voyez un message indiquant Bulk action available, le système a déterminé qu'il peut être possible de prendre une décision en bloc ( Link ou Unlink) qui s'applique à tous les problèmes de cette tâche. Cliquez sur Aperçu pour afficher une visualisation de l'apparence de vos modifications avant de prendre votre décision.
Cliquez sur Afficher les entités pour développer le panneau de comparaison.
Pour chaque décision de la tâche, vous pouvez choisir l'action à effectuer: lien manuel (Lien), lien manuel (Lien supprimé) ou ignorer le problème (Ignorer). Si possible, le système fournira une recommandation intelligente, vous fournissant une cote de confiance pour chaque recommandation.
Avant de prendre votre décision finale, vous pouvez également cliquer sur Aperçu pour afficher une visualisation de l'apparence de l'entité et de la structure d'enregistrement.
Prenez votre décision, puis confirmez-la dans la fenêtre modale en cliquant sur Lien, Supprimer le lienou sur Ignorer.
Astuce: Les modifications n'ont pas encore été appliquées aux données de votre système. Cliquez sur Soumettre pour appliquer les modifications.Cliquez sur Soumettre pour appliquer vos modifications et effectuer cette tâche. Si vous cliquez sur Rejeter, aucune modification n'est apportée.
Dans votre boîte de réception des tâches, cliquez sur Terminé pour afficher la liste de toutes les tâches que vous avez effectuées, y compris des détails sur chaque activité que vous avez effectuée dans le cadre de la tâche.
En savoir plus
- Surveillance des tâches de flux de travaux
- Exploration des entités et enregistrements de données de référence dans IBM Match 360
- Gestion des liens entre les enregistrements et les entités
- Configuration des flux de travaux de données maître
- Personnalisation et renforcement de l'algorithme de correspondance
Rubrique parent : Exploration des données maître