0 / 0
Retourner à la version anglaise de la documentation
Résolution des correspondances potentielles pour améliorer la qualité des données (IBM Match 360)
Dernière mise à jour : 05 déc. 2024
Résolution des correspondances potentielles pour améliorer la qualité des données (IBM Match 360)

Passez en revue et évaluez les correspondances d'enregistrement potentielles dans vos données d'entité. Prenez des décisions de liaison ou de suppression de liaison pour améliorer la qualité des données et augmenter la confiance dans les données de votre entité.

Utilisez les capacités de qualité des données de IBM Cloud Pak for Data et le service IBM Match 360 pour identifier, comprendre, faire remonter, corriger et prévenir les problèmes de qualité des données au sein de vos données d'entité.

Dans cette rubrique :

Avant de commencer

Avant de pouvoir commencer à générer des tâches de correspondance potentielle et à les résoudre, un ingénieur en traitement de données doit avoir effectué les tâches suivantes:

Affichage de la qualité des données d'actif et de la fiabilité des entités

Les propriétaires de projet et les collaborateurs peuvent afficher des informations sur la qualité des données pour leurs actifs de données. Les informations sur la qualité des données sont récapitulées dans une série de scores de dimension auxquels vous pouvez accéder à partir de l'onglet Qualité des données d'actif de votre projet.

L'une des dimensions qui contribue à l'évaluation de la qualité des données est la fiabilité de l'entité. La dimension de confiance d'entité est uniquement signalée pour les actifs de données d'entité IBM Match 360 connectés. La cote de confiance d'entité représente le pourcentage d'entités de données maître dans le système pour lesquelles IBM Match 360 est convaincu qu'elles sont correctes et complètes.

Vous pouvez améliorer la cote de confiance de l'entité d'un actif en optimisant votre algorithme de correspondance ou en remédiant aux problèmes de correspondance potentiels.

Pour plus d'informations sur la qualité des données, voir Informations sur la qualité des données pour les actifs de données.

Si la cote de confiance de l'entité de votre actif est faible, vos données peuvent bénéficier de la génération et de la résolution de certaines tâches de correspondances potentielles.

Pour afficher les informations sur la qualité des données et la cote de confiance de l'entité, procédez comme suit:

  1. Dans le menu de navigation Cloud Pak for Data , sélectionnez Projets > Tous les projets. Dans la page Projets, sélectionnez votre projet IBM Match 360 .
  2. Cliquez sur l'onglet Actifs du projet, puis sélectionnez l'actif de données maître connecté pour lequel vous souhaitez afficher l'analyse de la qualité des données.
  3. Sélectionnez l'onglet Qualité de données . La génération et l'affichage du rapport sur la qualité des données peut prendre un certain temps.
  4. Lorsque le rapport sur la qualité des données est disponible, examinez la cote de confiance de l'entité.
Astuce: Une fois que les intendants de données ont effectué une quantité importante de tâches de résolution, revenez à l'onglet Qualité de données pour voir comment les scores de votre actif se sont améliorés.

Génération de tâches pour les problèmes de correspondance potentiels

Avant de pouvoir passer en revue et résoudre les problèmes potentiels dans les entités correspondantes de vos données, vous devez générer des tâches de correspondance potentielles. Vous pouvez générer des tâches à partir de l'ensemble de données complet ou à partir d'un ensemble de résultats de recherche pour limiter la portée des tâches. Par exemple, vous pouvez choisir de concentrer vos tâches de résolution sur une certaine région géographique afin d'éviter de surcharger les boîtes de réception des tâches de vos intendants de données.

Autorisations requises
Pour créer et résoudre des tâches de correspondance potentielle, vous devez être membre du groupe d'utilisateurs de l'ingénieur en traitement de données ou de l'intendant de données pour le service IBM Match 360 .

Pour générer des tâches de résolution de correspondance potentielles:

  1. Dans le menu de navigation Données de base, cliquez sur Recherche 'icône de lancement de la recherche pour ouvrir la page de recherche des données de base.

  2. Vous pouvez éventuellement exécuter une recherche pour limiter la portée de vos données. Pour plus d'informations sur la recherche, voir Exploration des entités et des enregistrements de données maître dans IBM Match 360.

  3. Cliquez sur Créer des tâches.

  4. Définissez les paramètres de la création de la tâche de résolution.

    • Indiquez si vous souhaitez créer des tâches pour toutes les données ou les résultats de votre recherche en cours (le cas échéant).
    • Sélectionnez les types d'entités à inclure dans ces tâches.
    • Définissez le nombre de tâches que vous souhaitez créer au cours de cette action.
  5. Cliquez sur Créer des tâches pour commencer à générer les tâches de résolution.

Lorsque les tâches sont prêtes, elles apparaissent comme des tâches Résoudre les correspondances potentielles dans les boîtes de réception des tâches des utilisateurs affectés. Les affectations d'utilisateur sont définies dans la configuration de flux de travaux.

Si une entité incluse dans une tâche Résoudre les correspondances potentielles générée est mise à jour, manuellement ou via le processus de mise en correspondance, Cloud Pak for Data invalide et supprime automatiquement la tâche correspondante. S'il existe encore des problèmes de correspondance potentiels après la mise à jour de la mise en correspondance, vous pouvez recréer des tâches en répétant la procédure de génération de tâche.

Exécution de tâches pour résoudre les correspondances potentielles

En tant qu'utilisateur de l'intendant de données, lorsque vous rencontrez des problèmes de correspondance potentiels dans votre boîte de réception des tâches, vous pouvez les réclamer et résoudre les problèmes de qualité de données identifiés.

Pour résoudre les problèmes de correspondance potentiels:

  1. Dans le menu de navigation Cloud Pak for Data , sélectionnez Gouvernance > Boîte de réception des tâches. Votre boîte de réception des tâches s'ouvre pour afficher les tâches que vous avez affectées ou terminées.

  2. Vérifiez si vous avez des tâches Résoudre les correspondances potentielles dans votre boîte de réception.

    Cliquez sur l'icône de filtre " Icône Filtre pour accéder aux options de filtre que vous pouvez utiliser pour réduire la portée de votre boîte de réception. Par exemple, pour afficher uniquement les tâches de résolution: sous Type de tâche, sélectionnez Résolution, puis cliquez sur Appliquer. Vous pouvez également trier votre boîte de réception des tâches par date d'échéance ou par date d'affectation.

  3. Pour commencer à travailler sur une tâche, ouvrez-la et cliquez sur Réserver la tâche. Lorsque vous réclamez une tâche, le système l'empêche d'être utilisé par d'autres utilisateurs.

  4. Passez en revue les détails récapitulatifs de la tâche.

  5. Cliquez sur Résolution des problèmes pour commencer à comparer les enregistrements identifiés par la tâche. Une vue graphique s'ouvre pour vous montrer une représentation visuelle de tous les enregistrements et entités impliqués dans cette tâche de correspondance potentielle. Les correspondances potentielles entre les enregistrements sont représentées par des lignes en pointillés.

  6. Si vous le souhaitez, cliquez sur chaque enregistrement pour afficher ses détails.

  7. Dans le panneau des correspondances potentielles, vous verrez un élément pour chaque décision de correspondance potentielle incluse dans cette tâche. Cliquez sur chaque élément pour consulter les détails. Une comparaison côte à côte des enregistrements concernés vous sera présentée pour vous aider à prendre votre décision.

    Si vous voyez un message indiquant Bulk action available, le système a déterminé qu'il peut être possible de prendre une décision en bloc ( Link ou Unlink) qui s'applique à tous les problèmes de cette tâche. Cliquez sur Aperçu pour afficher une visualisation de l'apparence de vos modifications avant de prendre votre décision.

  8. Cliquez sur Afficher les entités pour développer le panneau de comparaison.

  9. Pour chaque décision de la tâche, vous pouvez choisir l'action à effectuer: lien manuel (Lien), lien manuel (Lien supprimé) ou ignorer le problème (Ignorer). Si possible, le système fournira une recommandation intelligente, vous fournissant une cote de confiance pour chaque recommandation.

    Avant de prendre votre décision finale, vous pouvez également cliquer sur Aperçu pour afficher une visualisation de l'apparence de l'entité et de la structure d'enregistrement.

    Prenez votre décision, puis confirmez-la dans la fenêtre modale en cliquant sur Lien, Supprimer le lienou sur Ignorer.

    Astuce: Les modifications n'ont pas encore été appliquées aux données de votre système. Cliquez sur Soumettre pour appliquer les modifications.
  10. Cliquez sur Soumettre pour appliquer vos modifications et effectuer cette tâche. Si vous cliquez sur Rejeter, aucune modification n'est apportée.

  11. Dans votre boîte de réception des tâches, cliquez sur Terminé pour afficher la liste de toutes les tâches que vous avez effectuées, y compris des détails sur chaque activité que vous avez effectuée dans le cadre de la tâche.

En savoir plus

Rubrique parent : Exploration des données maître

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus