0 / 0
Retourner à la version anglaise de la documentation
Tutoriel sur la gouvernance des données: Gouvernance des données virtualisées

Tutoriel sur la gouvernance des données: Gouvernance des données virtualisées

Cette Prenez ce tutoriel pour gouverner les données qui ont été virtualisées après avoir suivi le tutoriel Curate high quality data, le tutoriel Protéger vos donnéeset le tutoriel Virtualiser les données externes avec le cas d'utilisation Intégration de données de l'essai de matrice de données. Votre objectif est de protéger les données virtuelles qui contiennent les demandeurs et les demandes d'hypothèque et leurs scores de crédit pour les accès non autorisés. Certains renseignements personnels, comme le numéro de sécurité sociale, doivent être masqués afin que tous les employés de Golden Bank n'aient pas accès à ces renseignements personnels.

Démarrage rapide: Si vous n'avez pas encore créé l'exemple de projet pour ce tutoriel, accédez à l' exemple de projet de gouvernance des données dans le concentrateur de ressources.

L'histoire du tutoriel est que Golden Bank dispose de plusieurs services qui ont besoin d'accéder à des données de prêt hypothécaire client de haute qualité qui sont stockées dans trois sources de données externes. En tant qu'intendant de données dans l'équipe de gouvernance, vous devez enrichir les données virtualisées et vous assurer que les données virtualisées sont protégées.

L'image animée suivante fournit un aperçu rapide de ce que vous allez accomplir à la fin de ce tutoriel. Vous allez ajouter des données virtuelles à votre projet, puis les enrichir avec des termes métier, et voir comment les règles de protection des données d' IBM Knowledge Catalog masquent les données via Cloud Pak for Data as a Service. Cliquez sur l'image pour afficher une image plus grande.

Image animée

Aperçu du tutoriel

Dans ce tutoriel, vous exécutez les tâches suivantes :

Regarder une vidéo Regardez cette vidéo pour prévisualiser les étapes de ce tutoriel. Il peut y avoir de légères différences dans l'interface utilisateur affichée dans la vidéo. La vidéo est destinée à être un compagnon du tutoriel écrit.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.





Conseils pour l'exécution de ce tutoriel
Voici quelques conseils pour réussir ce tutoriel.

Utiliser la vidéo image-in-picture

Astuce: Démarrez la vidéo, puis au fur et à mesure que vous faites défiler le tutoriel, la vidéo passe en mode image-en-image. Fermez la table des matières vidéo pour la meilleure expérience avec l'image en image. Vous pouvez utiliser le mode image-dans-image pour pouvoir suivre la vidéo à mesure que vous effectuez les tâches de ce tutoriel. Cliquez sur les horodatages de chaque tâche à suivre.

L'image animée suivante montre comment utiliser les fonctions d'image vidéo et de table des matières:

Comment utiliser l'image en image et les chapitres

Obtenir de l'aide dans la communauté

Si vous avez besoin d'aide pour ce tutoriel, vous pouvez poser une question ou trouver une réponse dans le forum de discussion de la communautéCloud Pak for Data.

Configurez les fenêtres de votre navigateur

Pour une expérience optimale lors de l'exécution de ce tutoriel, ouvrez Cloud Pak for Data dans une fenêtre de navigateur et laissez cette page de tutoriel ouverte dans une autre fenêtre de navigateur pour basculer facilement entre les deux applications. Envisagez d'organiser les deux fenêtres du navigateur côte à côte pour faciliter le suivi.

Tutoriel et interface utilisateur côte à côte

Astuce: Si vous rencontrez une visite guidée lors de l'exécution de ce tutoriel dans l'interface utilisateur, cliquez sur Peut-être plus tard.



Configuration des prérequis

Suivez les tutoriels prérequis

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo à partir de 00:27.

Suivez les tutoriels suivants:




Tâche 1: Activer la gouvernance des données virtualisées

Deux étapes sont requises pour activer la gouvernance des données virtualisées:

  • Appliquez les règles de protection des données dans Watson Query.
  • Configurez l'autorisation entre IBM Knowledge Catalog et Watson Query.

Appliquer les règles de protection des données

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 01:02.

Pour appliquer des règles de protection des données dans Watson Query, procédez comme suit:

  1. Dans le menu de navigation Menu de navigation, choisissez Données > Data virtualization

  2. Si vous voyez une notification Configurer un catalogue principal pour appliquer la gouvernance, cliquez sur Aller à la gouvernance. Si ce message ne s'affiche pas, dans le menu du service, cliquez sur Administration > Paramètres de service, puis sur l'onglet Gouvernance .
    Menu Watson Query Service

  3. Activez l'option Appliquer les règles de protection des données aux objets virtuels et cliquez sur Sauvegarder.

  4. Dans le menu du service, revenez à Virtualisation > Sources de données.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre l'onglet Gouvernance avec l'application des règles activée. Ensuite, vous devez configurer l'autorisation entre IBM Knowledge Catalog et Data Virtualization.

Appliquer les règles

Configuration de l'autorisation entre IBM Knowledge Catalog et Watson Query

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 01:40.

Pour configurer l'autorisation entre IBM Knowledge Catalog et Watson Query, procédez comme suit:

  1. Visitez la page Autorisations dans la console IBM Cloud .

  2. Cliquez sur Créer.

  3. Pour Dans quel compte se trouve le service? , sélectionnez Ce compte.

  4. Pour Quel (s) service (s) doit (doivent) être accessible (s)? , sélectionnez IBM Knowledge Catalog.

  5. Pour Comment souhaitez-vous définir la portée de l'accès? dans IBM Knowledge Catalog, sélectionnez Toutes les ressources.

  6. Pour A quoi souhaitez-vous accorder l'accès à la source? , sélectionnez Watson Query.

  7. Pour Comment souhaitez-vous définir la portée de l'accès? dans Watson Query, sélectionnez Toutes les ressources.

  8. Pour Accès au service, sélectionnez DataAccess (Pour Service to Service Authorization uniquement).

  9. Cliquez sur Autoriser.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre la page Autorisations dans IBM Cloud avec l'autorisation entre IBM Knowledge Catalog et Data Virtualization. Vous êtes maintenant prêt à interroger les tables virtuelles gouvernées dans Data Virtualization.

Page Autorisations




Tâche 2: Exécuter une requête SQL sur les tables virtuelles gouvernées

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 02:20.

Lorsque des règles de protection des données sont en place, les tables virtuelles sont régies par ces règles. Pour exécuter une requête SQL sur une table virtuelle gouvernée, procédez comme suit:

  1. Dans le menu du service Watson Query , cliquez sur Exécuter SQL.
    Menu Watson Query Service

  2. Copiez et collez l'instruction SELECT suivante pour la nouvelle requête. Remplacez <your schema> par le nom de schéma que vous avez noté précédemment.

    SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    

    Votre requête est similaire à SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE'CA'
    Instruction SELECT

  3. Cliquez sur Exécuter tout.

  4. Une fois la requête terminée, sélectionnez-la dans l'onglet Historique . Dans l'onglet Résultats , vous pouvez voir que la table est filtrée uniquement pour les demandeurs de l'état de Californie. Les règles de protection des données s'appliquent dans Watson Query, l'aperçu du catalogue, le téléchargement du catalogue, Data Refineryet l'aperçu des actifs de projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à l'adresse 02:47 pour voir ce que les autres utilisateurs voient lorsqu'ils exécutent la requête SQL.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre les résultats de la requête SQL du point de vue d'un autre utilisateur. Vous êtes maintenant prêt à copier les tables virtuelles dans votre projet.

Résultats de la requête SQL




Tâche 3: Copier les données virtuelles dans votre projet

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 03:02.

Dans le tutoriel Virtualiser les données externes , vous avez créé des tables virtuelles et des vues de jointure virtuelle et vous les avez copiées dans votre projet d'intégration de données. Si vous souhaitez utiliser ce projet pour exécuter ce tutoriel, passez à la Tâche 3. Si vous souhaitez utiliser votre projet de gouvernance de données pour exécuter ce tutoriel, procédez comme suit:

  1. Dans le menu du service, cliquez sur Virtualisation > Données virtualisées.
    Menu Watson Query Service

  2. Sélectionnez les tableaux suivantes :

    • MORTGAGE_APPLICATION
    • MORTGAGE_APPLICANT
    • CREDIT_SCORE
    • APPLICANTS_APPLICATIONS_JOINT
    • APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINT
  3. Cliquez sur Assign.

  4. Pour le Projet, sélectionnez Gouvernance des données.

  5. Cliquez sur Assign.

  6. Une fois les objets virtuels correctement affectés, accédez à votre projet.

  7. Dans le projet Gouvernance des données , cliquez sur l'onglet Actifs . Les tables de données virtuelles commencent par <your schema>.

  8. Ouvrez l'une des tables de données virtuelles. Par exemple, cliquez sur la table virtuelle APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINT pour l'afficher.

  9. Indiquez vos données d'identification pour accéder à l'actif de données.

    1. Pour la méthode d'authentification, sélectionnez Clé d'API.

    2. Collez la même clé d'API que celle que vous avez créée dans le tutoriel Virtualiser les données externes . Coller la clé d'API

    3. Cliquez sur Connexion. Les règles de protection des données s'appliquent dans l'aperçu du catalogue, le téléchargement du catalogue, Data Refineryet l'aperçu des actifs de projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à l'adresse 04:09 pour voir ce que les autres utilisateurs voient en tentant d'accéder à la table de données virtuelles.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre la table virtuelle avec une colonne masquée dans le projet du point de vue d'un utilisateur différent. Vous êtes maintenant prêt à enrichir les données.

Table virtuelle dans le projet




Tâche 4: Enrichir les tables de données virtuelles

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 04:21.

Vous pouvez enrichir les actifs de données avec des informations qui aident les utilisateurs à trouver des données plus rapidement. Les utilisateurs peuvent utiliser les enrichissements pour déterminer si les données sont appropriées pour la tâche en cours, s'ils peuvent faire confiance aux données et comment les utiliser. Ces informations sont notamment des termes qui définissent la signification des données, des règles qui documentent la propriété ou déterminent des normes de qualité, ou des révisions. Procédez comme suit pour enrichir les tables de données virtuelles:

  1. Cliquez sur Gouvernance des données dans la piste de navigation pour revenir au projet.
    Trace de navigation

  2. Sur le Actifs onglet, cliquez sur Nouvel actif > Enrichir les actifs de données avec des métadonnées .

  3. Pour le nom, copiez et collez le texte suivant:

    Virtual mortgage data - metadata enrichment
    
  4. Cliquez sur Suivant pour continuer.

  5. Cliquez sur Sélectionner les données du projet.

    1. Sélectionnez Actif de données.

    2. Cochez la case en regard des actifs suivants:

      • <your schema>.MORTGAGE_APPLICATION
      • <your schema>.MORTGAGE_APPLICANT
      • <your schema>.CREDIT_SCORE
      • <your schema>.APPLICANTS_APPLICATIONS_JOINED
      • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
    3. Cliquez sur Sélectionner.

  6. Cliquez sur Suivant pour poursuivre l'objectif d'enrichissement.

  7. Sélectionner tous les objectifs d'enrichissement:

    • Données de profil
    • Affecter des termes
    • Exécuter l'analyse de qualité de base
  8. Pour Catégories, cliquez sur Sélectionner des catégories.

    1. Sélectionnez uniquement [ sans catégorie ] et Banque.

    2. Cliquez sur Sélectionner.

  9. Pour Échantillonnage, sélectionnez De base.

  10. Cliquez sur Suivant pour poursuivre l'exécution de la planification.

  11. Cliquez sur Suivant pour poursuivre l'examen.

  12. Cliquez sur Créer.

  13. L'actif d'enrichissement de métadonnées s'affiche, mais l'exécution du travail peut prendre plusieurs minutes. Cliquez sur l'icône Actualiser Actualiser pour surveiller le changement de statut de En file d'attente à En cours à Terminé. Une fois l'exécution du travail terminée, vous voyez les cinq actifs répertoriés.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre l'enrichissement des métadonnées terminé. Vous pouvez maintenant explorer les actifs de données enrichis.

Données enrichies




Tâche 5: Afficher les résultats de l'enrichissement des métadonnées

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo qui commence à 05:48.

Une fois l'exécution de l'enrichissement des métadonnées terminée, procédez comme suit pour afficher les données enrichies:

  1. Dans l'écran Données d'hypothèque virtuelle-enrichissement des métadonnées , cliquez sur l'onglet Colonnes .

  2. Recherchez mortgage_applicant.

  3. Dans la liste Colonnes, recherchez la colonne EMAIL_ADDRESS pour l'actif your-schema.MORTGAGE_APPLICANT .

    1. Cliquez sur le menu Dépassement Menu déroulant dynamique à la fin de la ligne EMAIL_ADDRESS de votre your_schema.MORTGAGE_APPLICANT et choisissez Afficher les détails de la colonne.

    2. Dans le panneau latéral de l'onglet Détails , vous pouvez voir des informations de profilage telles que: Format, Distribution des fréquences, Statistiques.

    3. Dans le panneau latéral, cliquez sur l'onglet Gouvernance . Cet onglet inclut les classes de données et les termes métier qui ont été affectés automatiquement lors de l'enrichissement des métadonnées. Vous pouvez également voir les termes métier et les classes de données suggérés et les affecter manuellement.

    4. Passez en revue les termes métier ou les classes de données suggérés et affectez-les manuellement. Par exemple, vous pouvez voir Adresse comme un terme métier suggéré.

      1. Cliquez sur Termes métier suggérés.

      2. Pour Adresse, cliquez sur Affecter.

      3. Cliquez sur Classes de données suggérées.

      4. Pour Texte, cliquez sur Affecter.

  4. A la fin de la colonne EMAIL_ADDRESS de votre ligne d'actif your_schema.MORTGAGE_APPLICANT , cliquez sur le menu Dépassement Menu déroulant dynamiqueet sélectionnez Afficher les détails de la qualité des données.

    1. Affichez le score de qualité des données. IBM Knowledge Catalog génère automatiquement un score de qualité de données pour chaque colonne et actif de données en analysant chaque valeur de chaque enregistrement en fonction de dimensions préconfigurées.

    2. Cliquez sur le X pour fermer la fenêtre Qualité de données .

  5. Recherchez credit_score.

  6. Pour la colonne CITY de l'actif your_schema.CREDIT_SCORE , cliquez sur le menu Overflow Menu déroulant dynamiqueet choisissez Marquer comme révisé.

  7. Cliquez sur l'onglet Actifs.

  8. Dans la liste Actifs, pour votre actif your_schema.MORTGAGE_APPLICANT , cliquez sur le menu Dépassement Menu déroulant dynamiqueet sélectionnez Afficher les détails de l'actif.

    1. Dans le panneau latéral, cliquez sur l'onglet Gouvernance pour afficher les termes métier qui ont été affectés automatiquement.

    2. Cliquez sur l'icône Ajouter Ajouter (ou vous pouvez voir l'icône Editer Editer) pour affecter manuellement des termes métier.

    3. Recherchez social. Si vous ne voyez aucun résultat, assurez-vous que la liste déroulante est définie sur Tous les termes au lieu de Termes suggérés.

    4. Sélectionnez Numéro de sécurité sociale.

    5. Cliquez sur Assign.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre les actifs de données révisés et enrichis. L'étape suivante consiste à publier les données enrichies dans un catalogue à partager avec votre organisation.

Actifs de données enrichis révisés




Tâche 6: Publier des tables virtuelles dans un catalogue

vidéo du tutoriel d'aperçu Pour prévisualiser cette tâche, regardez la vidéo à partir de 7:18.

Maintenant que les données virtualisées sont enrichies avec des termes métier, procédez comme suit pour publier les tables virtuelles dans un catalogue:

  1. Cliquez sur Gouvernance des données dans la piste de navigation pour revenir au projet.
    Trace de navigation

  2. Cliquez sur l'onglet Actifs.

  3. Accédez à Données > Actifs de données.

  4. Cochez la case en regard des actifs suivants:

    • <your schema>.MORTGAGE_APPLICATION
    • <your schema>.MORTGAGE_APPLICANT
    • <your schema>.CREDIT_SCORE
    • <your schema>.APPLICANTS_APPLICATIONS_JOINED
    • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
  5. Cliquez sur Publier dans le catalogue.

    1. Sélectionnez le catalogue d'approbation hypothécaire (ou le nom de votre catalogue) dans la liste, puis cliquez sur Suivant.

    2. Sélectionnez l'option permettant d' accéder au catalogue après sa publication, puis cliquez sur Suivant.

    3. Passez en revue les actifs et cliquez sur Publier.

  6. Dans Mortgage Approval Catalog, recherchez <your-schema>.

  7. Ouvrez l'une des tables virtuelles. Si vous y êtes invité, indiquez vos données d'identification:

    1. Pour la méthode d'authentification, sélectionnez Clé d'API.

    2. Collez la même clé d'API que celle que vous avez créée dans le tutoriel Virtualiser les données externes .

  8. Cliquez sur l'onglet Actif pour afficher les données. Les règles de protection des données s'appliquent dans l'aperçu du catalogue, le téléchargement du catalogue, Data Refineryet l'aperçu des actifs de projet. La règle ne s'applique pas au propriétaire de l'actif. Regarder une vidéo Regardez la vidéo à l'adresse 08:17 pour voir ce que les autres utilisateurs voient en tentant d'accéder à la table de données virtuelles dans le catalogue.

Icône de point de contrôle Vérifiez votre progression

L'image suivante montre l'aperçu des données de la table virtuelle dans le catalogue du point de vue de l'utilisateur.

Prévisualiser un catalogue



En tant qu'ingénieurs en traitement de données et intendants de données chez Golden Bank, vous avez enrichi les données virtualisées pour vous assurer qu'elles sont protégées.

Nettoyage (facultatif)

Si vous souhaitez reprendre les tutoriels dans le cas d'utilisation de la gouvernance des données, reportez-vous à la section Nettoyer dans chacun des tutoriels prérequis:


Etapes suivantes

En savoir plus

Rubrique parent: Tutoriels de cas d'utilisation

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus