0 / 0
Retourner à la version anglaise de la documentation
Tutoriel sur la gouvernance des données: Gouvernance des données virtualisées
Dernière mise à jour : 28 nov. 2024
Tutoriel sur la gouvernance des données: Gouvernance des données virtualisées

Cette Suivez ce tutoriel pour régir les données qui ont été virtualisées après avoir terminé les tutoriels Curate high quality data, Protect your data, et Virtualize external data avec le cas d'utilisation Data integration of the data fabric trial. Votre objectif est de protéger les données virtuelles qui contiennent les demandeurs et les demandes d'hypothèque et leurs scores de crédit pour les accès non autorisés. Certains renseignements personnels, comme le numéro de sécurité sociale, doivent être masqués afin que tous les employés de Golden Bank n'aient pas accès à ces renseignements personnels.

Démarrage rapide: Si vous n'avez pas encore créé l'exemple de projet pour ce tutoriel, accédez à l' exemple de projet de gouvernance des données dans le concentrateur de ressources.

L'histoire du tutoriel est que Golden Bank dispose de plusieurs services qui ont besoin d'accéder à des données de prêt hypothécaire client de haute qualité qui sont stockées dans trois sources de données externes. En tant qu'intendant de données dans l'équipe de gouvernance, vous devez enrichir les données virtualisées et vous assurer que les données virtualisées sont protégées.

L'image animée suivante fournit un aperçu rapide de ce que vous allez accomplir à la fin de ce tutoriel. Vous allez ajouter des données virtuelles à votre projet, puis les enrichir avec des termes métier, et voir comment les règles de protection des données d' IBM Knowledge Catalog masquent les données via Cloud Pak for Data as a Service. Cliquez sur l'image pour afficher une image plus grande.

Image animée

Aperçu du tutoriel

Dans ce tutoriel, vous exécutez les tâches suivantes :

Regarder une vidéo Regardez cette vidéo pour prévisualiser les étapes de ce tutoriel. Il peut y avoir de légères différences dans l'interface utilisateur affichée dans la vidéo. La vidéo est destinée à être un compagnon du tutoriel écrit.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.





Conseils pour l'exécution de ce tutoriel
Voici quelques conseils pour réussir ce tutoriel.

Utiliser la vidéo image-in-picture

Astuce: Démarrez la vidéo, puis au fur et à mesure que vous faites défiler le tutoriel, la vidéo passe en mode image-en-image. Fermez la table des matières vidéo pour la meilleure expérience avec l'image en image. Vous pouvez utiliser le mode image-dans-image pour pouvoir suivre la vidéo à mesure que vous effectuez les tâches de ce tutoriel. Cliquez sur les horodatages de chaque tâche à suivre.

L'image animée suivante montre comment utiliser les fonctions d'image vidéo et de table des matières:

Comment utiliser l'image en image et les chapitres

Obtenir de l'aide dans la communauté

Si vous avez besoin d'aide pour ce tutoriel, vous pouvez poser une question ou trouver une réponse dans le forum de discussion de la communautéCloud Pak for Data.

Configurez les fenêtres de votre navigateur

Pour une expérience optimale lors de l'exécution de ce tutoriel, ouvrez Cloud Pak for Data dans une fenêtre de navigateur et laissez cette page de tutoriel ouverte dans une autre fenêtre de navigateur pour basculer facilement entre les deux applications. Envisagez d'organiser les deux fenêtres du navigateur côte à côte pour faciliter le suivi.

Tutoriel et interface utilisateur côte à côte

Astuce: Si vous rencontrez une visite guidée lors de l'exécution de ce tutoriel dans l'interface utilisateur, cliquez sur Peut-être plus tard.



Configuration des prérequis

Suivez les tutoriels prérequis

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 00:27.

Suivez les tutoriels suivants:

Base Premium Standard Sauf indication contraire, ces informations s'appliquent à toutes les éditions d'IBM Knowledge Catalog




Tâche 1: Activer la gouvernance des données virtualisées

Deux étapes sont requises pour activer la gouvernance des données virtualisées:

  • Appliquer les règles de protection des données dans le cadre de la Data Virtualization.
  • Configurer l'autorisation entre IBM Knowledge Catalog et Data Virtualization.

Appliquer les règles de protection des données

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 01:02.

Procédez comme suit pour appliquer les règles de protection des données dans le cadre de la Data Virtualization:

  1. Dans le menu de navigation " Menu de navigation, choisissez Données > Data virtualization.

  2. Si vous voyez une notification Configurer un catalogue principal pour appliquer la gouvernance, cliquez sur Aller à la gouvernance. Si vous ne voyez pas ce message, dans le menu du service, cliquez sur Administration > Paramètres du service, puis sur l'onglet Gouvernance.
    Menu du service de Data Virtualization

  3. Activez l'option Appliquer les règles de protection des données aux objets virtuels et cliquez sur Sauvegarder.

  4. Dans le menu du service, revenez à Virtualisation > Sources de données.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre l'onglet Gouvernance avec l'application des règles activée. Ensuite, vous devez configurer l'autorisation entre IBM Knowledge Catalog et Data Virtualization.

Appliquer les règles

Configurer l'autorisation entre IBM Knowledge Catalog et Data Virtualization

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 01:40.

Procédez comme suit pour configurer l'autorisation entre IBM Knowledge Catalog et Data Virtualization:

  1. Visitez la page Autorisations dans la console IBM Cloud

  2. Cliquez sur Créer.

  3. Pour Dans quel compte se trouve le service? , sélectionnez Ce compte.

  4. Pour Quel (s) service (s) doit (doivent) être accessible (s)? , sélectionnez IBM Knowledge Catalog.

  5. Pour Comment souhaitez-vous définir la portée de l'accès? dans IBM Knowledge Catalog, sélectionnez Toutes les ressources.

  6. Pour A quoi souhaitez-vous accorder l'accès à la source? sélectionnez Data Virtualization.

  7. Pour Comment souhaitez-vous définir la portée de l'accès? à Data Virtualization, sélectionnez Toutes les ressources.

  8. Pour Accès au service, sélectionnez DataAccess (Pour Service to Service Authorization uniquement).

  9. Cliquez sur Autoriser.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre la page Autorisations dans IBM Cloud avec l'autorisation entre IBM Knowledge Catalog et Data Virtualization. Vous êtes maintenant prêt à interroger les tables virtuelles gouvernées dans Data Virtualization.

Page Autorisations




Tâche 2: Exécuter une requête SQL sur les tables virtuelles gouvernées

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 02:20.

Lorsque des règles de protection des données sont en place, les tables virtuelles sont régies par ces règles. Pour exécuter une requête SQL sur une table virtuelle gouvernée, procédez comme suit:

  1. Dans le menu du service de Data Virtualization, cliquez sur Exécuter SQL.
    Menu du service de Data Virtualization

  2. Copiez et collez l'instruction SELECT suivante pour la nouvelle requête. Remplacez <your schema> par le nom de schéma que vous avez noté précédemment.

    SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    

    Votre requête ressemble à 'SELECT * FROM 'DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA' (code d'état) '
    'Instruction SELECT'

  3. Cliquez sur Exécuter tout.

  4. Une fois la requête terminée, sélectionnez-la dans l'onglet Historique . Dans l'onglet Résultats , vous pouvez voir que la table est filtrée uniquement pour les demandeurs de l'état de Californie. Les règles de protection des données s'appliquent à la Data Virtualization, à l'aperçu du catalogue, au téléchargement du catalogue, à l'Data Refinery et à l'aperçu des actifs du projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à 02:47 pour voir ce que les autres utilisateurs voient lorsqu'ils exécutent la requête SQL.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre les résultats de la requête SQL du point de vue d'un autre utilisateur. Vous êtes maintenant prêt à copier les tables virtuelles dans votre projet.

Résultats de la requête SQL




Tâche 3: Copier les données virtuelles dans votre projet

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 03:02.

Dans le tutoriel Virtualiser les données externes , vous avez créé des tables virtuelles et des vues de jointure virtuelle et vous les avez copiées dans votre projet d'intégration de données. Si vous souhaitez utiliser ce projet pour exécuter ce tutoriel, passez à la Tâche 3. Si vous souhaitez utiliser votre projet de gouvernance de données pour exécuter ce tutoriel, procédez comme suit:

  1. Dans le menu de service, cliquez sur Virtualisation > Données virtualisées.
    Menu du service de Data Virtualization

  2. Sélectionnez les tableaux suivantes :

    • MORTGAGE_APPLICATION
    • MORTGAGE_APPLICANT
    • CREDIT_SCORE
    • APPLICANTS_APPLICATIONS_JOINT
    • APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINT
  3. Cliquez sur Assign.

  4. Pour le Projet, sélectionnez Gouvernance des données.

  5. Cliquez sur Assign.

  6. Une fois les objets virtuels correctement affectés, accédez à votre projet.

  7. Dans le projet Gouvernance des données , cliquez sur l'onglet Actifs . Les tables de données virtuelles commencent par <your schema>.

  8. Ouvrez l'une des tables de données virtuelles. Par exemple, cliquez sur la table virtuelle APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINT pour l'afficher.

  9. Indiquez vos données d'identification pour accéder à l'actif de données.

    1. Pour la méthode d'authentification, sélectionnez Clé d'API.

    2. Collez la même clé API que vous avez créée dans le tutoriel Virtualiser les données externes. Coller la clé d'API

    3. Cliquez sur Connexion. Les règles de protection des données s'appliquent dans l'aperçu du catalogue, le téléchargement du catalogue, Data Refineryet l'aperçu des actifs de projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à 04:09 pour voir ce que les autres utilisateurs voient en essayant d'accéder à la table de données virtuelle.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre la table virtuelle avec une colonne masquée dans le projet du point de vue d'un utilisateur différent. Vous êtes maintenant prêt à enrichir les données.

Table virtuelle dans le projet




Tâche 4: Enrichir les tables de données virtuelles

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 04:21.

Vous pouvez enrichir les actifs de données avec des informations qui aident les utilisateurs à trouver des données plus rapidement. Les utilisateurs peuvent utiliser les enrichissements pour déterminer si les données sont appropriées pour la tâche en cours, s'ils peuvent faire confiance aux données et comment les utiliser. Ces informations sont notamment des termes qui définissent la signification des données, des règles qui documentent la propriété ou déterminent des normes de qualité, ou des révisions. Procédez comme suit pour enrichir les tables de données virtuelles:

  1. Cliquez sur Gouvernance des données dans la piste de navigation pour revenir au projet.
    Trace de navigation

  2. Sur le Actifs onglet, cliquez sur Nouvel actif > Enrichir les actifs de données avec des métadonnées .

  3. Pour le nom, copiez et collez le texte suivant:

    Virtual mortgage data - metadata enrichment
    
  4. Cliquez sur Suivant pour continuer.

  5. Cliquez sur Sélectionner les données du projet.

    1. Sélectionnez Actif de données.

    2. Cochez la case en regard des actifs suivants:

      • <your schema>.MORTGAGE_APPLICATION
      • <your schema>.MORTGAGE_APPLICANT
      • <your schema>.CREDIT_SCORE
      • <your schema>.APPLICANTS_APPLICATIONS_JOINED
      • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
    3. Cliquez sur Sélectionner.

  6. Cliquez sur Suivant pour poursuivre l'objectif d'enrichissement.

  7. Sélectionner tous les objectifs d'enrichissement:

    • Données de profil
    • Affecter des termes
    • Exécuter l'analyse de qualité de base
  8. Pour Catégories, cliquez sur Sélectionner des catégories.

    1. Sélectionnez uniquement [ sans catégorie ] et Banque.

    2. Cliquez sur Sélectionner.

  9. Pour Échantillonnage, sélectionnez De base.

  10. Cliquez sur Suivant pour poursuivre l'exécution de la planification.

  11. Cliquez sur Suivant pour poursuivre l'examen.

  12. Cliquez sur Créer.

  13. L'actif d'enrichissement de métadonnées s'affiche, mais l'exécution du travail peut prendre plusieurs minutes. Cliquez sur l'icône d'actualisation " Actualiser pour voir le statut passer de " En attente " à " En cours " puis à " Terminé". Une fois l'exécution du travail terminée, vous voyez les cinq actifs répertoriés.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre l'enrichissement des métadonnées terminé. Vous pouvez maintenant explorer les actifs de données enrichis.

Données enrichies




Tâche 5: Afficher les résultats de l'enrichissement des métadonnées

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 05:48.

Une fois l'exécution de l'enrichissement des métadonnées terminée, procédez comme suit pour afficher les données enrichies:

  1. Dans l'écran Données d'hypothèque virtuelle-enrichissement des métadonnées , cliquez sur l'onglet Colonnes .

  2. Recherchez mortgage_applicant.

  3. Dans la liste Colonnes, recherchez la colonne EMAIL_ADDRESS pour l'actif your-schema.MORTGAGE_APPLICANT .

    1. Cliquez sur le menu de débordement " Menu déroulant dynamique à la fin de la ligne EMAIL_ADDRESS for your_schema.MORTGAGE_APPLICANT, et choisissez View column details.

    2. Dans le panneau latéral de l'onglet Détails , vous pouvez voir des informations de profilage telles que: Format, Distribution des fréquences, Statistiques.

    3. Dans le panneau latéral, cliquez sur l'onglet Gouvernance . Cet onglet inclut les classes de données et les termes métier qui ont été affectés automatiquement lors de l'enrichissement des métadonnées. Vous pouvez également voir les termes métier et les classes de données suggérés et les affecter manuellement.

    4. Passez en revue les termes métier ou les classes de données suggérés et affectez-les manuellement. Par exemple, vous pouvez voir Adresse comme un terme métier suggéré.

      1. Cliquez sur Termes métier suggérés.

      2. Pour Adresse, cliquez sur Affecter.

      3. Cliquez sur Classes de données suggérées.

      4. Pour Texte, cliquez sur Affecter.

  4. À la fin de la colonne EMAIL_ADDRESS de votre ligne d'actif your_schema.MORTGAGE_APPLICANT, cliquez sur le menu Overflow 'Menu déroulant dynamique et choisissez View data quality details.

    1. Affichez le score de qualité des données. IBM Knowledge Catalog génère automatiquement un score de qualité de données pour chaque colonne et actif de données en analysant chaque valeur de chaque enregistrement en fonction de dimensions préconfigurées.

    2. Cliquez sur le X pour fermer la fenêtre Qualité de données .

  5. Recherchez credit_score.

  6. Pour la colonne CITY de l'actif your_schema.CREDIT_SCORE, cliquez sur le menu de débordement 'Menu déroulant dynamique et choisissez Mark as reviewed.

  7. Cliquez sur l'onglet Actifs.

  8. Dans la liste des actifs, pour votre actif your_schema.MORTGAGE_APPLICANT, cliquez sur le menu de débordement 'Menu déroulant dynamique, et choisissez View asset details.

    1. Dans le panneau latéral, cliquez sur l'onglet Gouvernance pour afficher les termes métier qui ont été affectés automatiquement.

    2. Cliquez sur l'icône Ajouter " Ajouter (ou sur l'icône Modifier " Editer) pour attribuer manuellement des termes commerciaux.

    3. Recherchez social. Si vous ne voyez aucun résultat, assurez-vous que la liste déroulante est définie sur Tous les termes au lieu de Termes suggérés.

    4. Sélectionnez Numéro de sécurité sociale.

    5. Cliquez sur Assign.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre les actifs de données révisés et enrichis. L'étape suivante consiste à publier les données enrichies dans un catalogue à partager avec votre organisation.

Actifs de données enrichis révisés




Tâche 6: Publier des tables virtuelles dans un catalogue

vidéo du tutoriel d'aperçu Pour avoir un aperçu de cette tâche, regardez la vidéo à partir de 7:18.

Maintenant que les données virtualisées sont enrichies avec des termes métier, procédez comme suit pour publier les tables virtuelles dans un catalogue:

  1. Cliquez sur Gouvernance des données dans la piste de navigation pour revenir au projet.
    Trace de navigation

  2. Cliquez sur l'onglet Actifs.

  3. Accédez à Données > Actifs de données.

  4. Cochez la case en regard des actifs suivants:

    • <your schema>.MORTGAGE_APPLICATION
    • <your schema>.MORTGAGE_APPLICANT
    • <your schema>.CREDIT_SCORE
    • <your schema>.APPLICANTS_APPLICATIONS_JOINED
    • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
  5. Cliquez sur Publier dans le catalogue.

    1. Sélectionnez le catalogue d'approbation hypothécaire (ou le nom de votre catalogue) dans la liste, puis cliquez sur Suivant.

    2. Sélectionnez l'option permettant d' accéder au catalogue après sa publication, puis cliquez sur Suivant.

    3. Passez en revue les actifs et cliquez sur Publier.

  6. Dans Mortgage Approval Catalog, recherchez <your-schema>.

  7. Ouvrez l'une des tables virtuelles. Si vous y êtes invité, indiquez vos données d'identification:

    1. Pour la méthode d'authentification, sélectionnez Clé d'API.

    2. Collez la même clé d'API que celle que vous avez créée dans le tutoriel Virtualiser les données externes .

  8. Cliquez sur l'onglet Actif pour afficher les données. Les règles de protection des données s'appliquent dans l'aperçu du catalogue, le téléchargement du catalogue, Data Refineryet l'aperçu des actifs de projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à 08:17 pour voir ce que les autres utilisateurs voient en essayant d'accéder à la table de données virtuelle dans le catalogue.

Icône de point de contrôle Vérifier votre progression

L'image suivante montre l'aperçu des données de la table virtuelle dans le catalogue du point de vue de l'utilisateur.

Prévisualiser un catalogue



En tant qu'ingénieurs en traitement de données et intendants de données chez Golden Bank, vous avez enrichi les données virtualisées pour vous assurer qu'elles sont protégées.

Nettoyage (facultatif)

Si vous souhaitez reprendre les tutoriels dans le cas d'utilisation de la gouvernance des données, reportez-vous à la section Nettoyer dans chacun des tutoriels prérequis:


Etapes suivantes

En savoir plus

Rubrique parent: Tutoriels de cas d'utilisation

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus