Tutoriel : Protégez vos données

Suivez ce tutoriel pour protéger vos données avec le cas d'utilisation de la gouvernance des données et de la confidentialité de l'offre d'essai de la matrice de données. Votre objectif est de contrôler l'accès aux données entre les services de la matrice de données.

Le cas d'utilisation de ce tutoriel est que la Golden Bank a plusieurs départements qui ont besoin d'accéder à des données hypothécaires client de haute qualité. En tant que responsable des données de l'équipe de gouvernance, vous allez créer des règles de protection des données et construire des flux de masquage afin de protéger les données hypothécaires confidentielles.

Dans ce tutoriel, vous exécuterez les tâches suivantes :

  1. Créer une règle de protection des données pour refuser l'accès.
  2. Créer une règle de protection des données pour masquer les données.
  3. Importer les données dans le projet.
  4. Enrichir les données.
  5. Afficher les résultats de l'enrichissement des métadonnées.
  6. Créer un catalogue.
  7. Publier des actifs dans un catalogue.

Si vous avez besoin d'aide pour ce tutoriel, posez une question ou trouvez une réponse dans le forum de discussion communautaire Cloud Pak for Data.

Astuce : Pour une expérience optimale dans l'exécution de ce tutoriel, ouvrez Cloud Pak for Data en tant que service dans un onglet de navigateur, et gardez cette page de tutoriel ouverte dans un autre onglet de navigateur pour basculer facilement entre les deux applications.

Prérequis

Vous devez vous inscrire pour Cloud Pak for Data en tant que service et fournir les services nécessaires pour le cas d'utilisation de la gouvernance des données et de la confidentialité.

Vous pouvez vous inscrire pour Cloud Pak for Data en tant que service de l'une des manières suivantes :

Mettez à disposition les services nécessaires

Suivez ces étapes pour vérifier ou mettre à disposition les services nécessaires.

  1. Dans le menu de navigation Cloud Pak for Data, sélectionnez Services > Instances de service.
  2. Utilisez la liste déroulante Produit pour déterminer s'il existe une instance de service Watson Knowledge Catalog existante.
  3. Si vous devez créer une instance de service Watson Knowledge Catalog, cliquez sur Ajouter un service.
  4. Sélectionnez Watson Knowledge Catalog.
  5. Sélectionnez le plan Lite.
  6. Cliquez sur Créer.

Faites confiance à vos données

Regarder une vidéo Pour prévisualiser cette tâche, regardez la vidéo à partir de 00:47.

Exécutez le tutoriel Faites confiance à vos données pour importer et enrichir des actifs de données et les publier dans un catalogue.

Étape 1 : Création d'une règle de protection des données pour refuser l'accès

Regarder une vidéo Pour prévisualiser cette tâche, regardez la vidéo à partir de 02:23.

Une règle de protection des données contrôle l'accès à un actif de données. Suivez ces étapes pour créer une règle de protection des données pour refuser l'accès à des informations confidentielles dans certains actifs de données hypothécaires.

  1. Dans le menu de navigation Cloud Pak for Data, sélectionnez Catalogues > Afficher tous les catalogues.
  2. Ouvrez le fichier Catalogue d'approbation d'hypothèque.
  3. Cliquez sur l'actif de données CREDIT_SCORE. Notez qu'il contient la balise Confidentiel. Vous allez créer une règle pour refuser l'accès à cet actif de données.
  4. Dans le menu de navigation Cloud Pak for Data, sélectionnez Gouvernance > Règles.
  5. Cliquez sur Ajouter une règle > Nouvelle règle.
  6. Sélectionnez Règle de protection des données.
  7. Cliquez sur Suivant.
  8. Pour le nom de règle, entrez Confidential Information.
  9. Pour la Définition métier, entrez Rule to prevent unauthorized users from accessing data assets that have been tagged as confidential.
  10. Pour la condition 1, sélectionnez les options suivantes.
    • Balise
    • contient
    • Données d'identification
  11. Pour l'action, sélectionnez Refuser l'accès aux données.
  12. Cliquez sur Créer. Cette règle refuse désormais l'accès aux données pour toute personne qui tente d'accéder à des actifs de données marqués comme " Confidentiel ". Cette règle s'applique à l'aperçu du catalogue, au téléchargement de catalogue, à Data Refinery et à l'aperçu de l'actif du projet. Notez que la règle ne s'applique pas à la personne qui a créé la règle ou ajouté un actif à un projet. Regardez la vidéo à XX:XX pour voir ce que d'autres utilisateurs verront essayer d'accéder à la ressource de données CREDIT_SCORE.

Étape 2 : Création d'une règle de protection des données pour masquer les données

Regarder une vidéo Pour prévisualiser cette tâche, regardez la vidéo à partir de 02:23.

Procédez comme suit pour créer une règle de protection des données qui masque les actifs de données contenant des colonnes avec un numéro de sécurité sociale américain.

  1. Dans le catalogue d'approbation d'hypothèque, cliquez sur l'actif de données MORTGAGE_APPLICANTS.
  2. Cliquez sur l'onglet Actif pour prévisualiser les données. Notez que l'une des colonnes contient des numéros de sécurité sociale. Vous allez créer une règle pour masquer cette colonne.
  3. Dans le menu de navigation Cloud Pak for Data, sélectionnez Gouvernance > Règles.
  4. Cliquez sur Ajouter une règle > Nouvelle règle.
  5. Sélectionnez Règle de projection de données.
  6. Cliquez sur Suivant.
  7. Pour le nom de règle, entrez Redact Social Security Number.
  8. Pour la Définition métier, entrez Rule to redact Social Security Number.
  9. Pour la Condition 1, sélectionnez les options suivantes :
    • Terme métier
    • contient
    • Numéro de sécurité sociale
  10. Pour Action, sélectionnez Masquer les données. Terme métier et Numéro de sécurité sociale seront remplis pour vous.
  11. Pour les options de masquage, sélectionnez Occulter. Cela remplacera les données avec Xs. Vous pouvez survoler chaque option de masquage pour voir les exemples de données masqués à l'aide de l'option sélectionnée.
  12. Cliquez sur Créer. Cette règle occulte les colonnes avec les numéros de sécurité sociale américains dans les actifs de données. Regardez la vidéo à XX:XX pour voir ce que les autres utilisateurs verront accéder à l'actif de données MORTGAGE_APPLICANTS.

Étape 3 : Création d'une règle de protection des données avec masquage avancé

Regarder une vidéo Pour prévisualiser cette tâche, regardez la vidéo à partir de 02:23.

Procédez comme suit pour créer une règle de protection des données qui masque les actifs de données contenant des colonnes avec une adresse électronique.

  1. Dans le menu de navigation Cloud Pak for Data, sélectionnez Catalogues > Afficher tous les catalogues.
  2. Ouvrez le fichier Catalogue d'approbation d'hypothèque.
  3. Cliquez sur l'actif de données MORTGAGE_APPLICANTS. Notez que l'une des colonnes contient l'adresse électronique. Vous allez créer une règle pour masquer cette colonne à l'aide du masquage avancé.
  4. Dans le menu de navigation Cloud Pak for Data, sélectionnez Gouvernance > Règles.
  5. Cliquez sur Ajouter une règle > Nouvelle règle.
  6. Sélectionnez Règle de projection de données.
  7. Cliquez sur Suivant.
  8. Pour le nom de règle, entrez Obfuscate email address.
  9. Pour la Définition métier, entrez Rule to obfuscate the email address using advanced masking options.
  10. Pour la Condition 1, sélectionnez les options suivantes :
    • Classe de données
    • contient
    • Adresse électronique
  11. Pour Action, sélectionnez Masquer les données.
  12. Dans la zone avec les colonnes, sélectionnez Classe de données. Adresse électronique sera rempli pour vous.
  13. Pour les options de masquage, sélectionnez Brouiller.
  14. Sélectionnez Activer les options de masquage avancées.
  15. Sélectionnez Aperçu automatique de la régénération pour régénérer l'aperçu à chaque fois pour passer à une option.
  16. Pour la méthode de brouillage, sélectionnez Conserver le format. La méthode de conservation du format vous permet de générer un nom d'utilisateur ou de fournir un préfixe et un numéro pour le nom d'utilisateur.
    1. Sélectionnez Préfixe plus numéro et entrez mail pour afficher un aperçu.
    2. Dans ce scénario, il serait préférable de sélectionner Générer un nom d'utilisateur.
  17. L'option Nom de domaine inclut trois options :
    1. Sélectionnez Services de messagerie électronique communs pour prévisualiser l'apparence de l'adresse électronique.
    2. Sélectionnez Personnalisé pour prévisualiser l'apparence de l'adresse électronique.
    3. Pour ce scénario, il serait préférable de sélectionner Original.
  18. Pour la réversabilité, la seule option est Masquage irréversible, qui est permanente. Pour d'autres types de données, vous pouvez avoir l'option de sélectionner Masquage réversible qui vous permet de récupérer les valeurs d'origine à l'aide d'une clé de chiffrement.
  19. Pour la Cohérence, sélectionnez reproductible. L'option reproductible garantit que le masquage sera fait avec intégrité référentielle, ce qui signifie que chaque fois que l'adresse électronique est smith.lee, qui sera remplacée par shoshana.vitrano.
  20. Pour la Validation de la saisie, conservez la valeur par défaut de la Validation de la saisie. L'option de validation de saisie vérifie s'il existe une valeur incorrecte et supprime les lignes dont les valeurs ne sont pas formatées correctement.
  21. Cliquez sur Créer. Avec cette règle en place, les données dans un catalogue sont protégées pour les utilisateurs de données, lorsqu'elles prévisualisez dynamiquement les données dans le catalogue ou lorsqu'elles extraient statiquement des copies de données via un flux de masquage. Regardez la vidéo à XX:XX pour voir ce que les autres utilisateurs verront accéder à l'actif de données MORTGAGE_APPLICANTS.

Étape 4 : Création d'un flux de masquage

Regarder une vidéo Pour prévisualiser cette tâche, regardez la vidéo à partir de 02:23.

Un flux de masquage contient des copies masquées ou des sous-ensembles masqués de données du catalogue vers différentes bases de données cible. Les copies créées seront dés-identifiées à l'aide d'options de masquage avancées avec les règles de protection des données que l'administrateur a définies précédemment. Procédez comme suit pour créer et exécuter un flux de masquage.

  1. Dans le menu de navigation Cloud Pak for Data, sélectionnez Catalogues > Afficher tous les catalogues.
  2. Cliquez sur Catalogue d'approbation d'hypothèque.
  3. Sélectionnez l'actif de données MORTGAGE_APPLICANTS dans le catalogue.
  4. Cliquez sur Ajouter au projet.
    1. Pour la cible, sélectionnez le projet de gouvernance des données et de confidentialité.
    2. Cliquez sur Ajouter.
  5. Dans le menu de navigation Cloud Pak for Data, sélectionnez Projets > Afficher tous les projets.
  6. Cliquez sur le projet Gouvernance des données et confidentialité.
  7. Cliquez sur l'onglet Actifs.
  8. Cliquez sur Nouvel actif.
  9. Sélectionnez Protection des données.
  10. Pour le Nom, entrez Applicants in California.
  11. Pour la Description, entrez Creates masked copy of applicants and related recrods for applicants in California.
  12. Cliquez sur Suivant.
  13. Il existe deux types de masquage. Copier une ou plusieurs tableaux de produits copies masquées de tableaux sans rechercher de liens. Copier d'un tableau de pilotes et de données associées vous permet de créer des sous-ensembles de données avec des relations de clé primaire et de clé externe et d'avoir des sous-ensembles associés. Dans ce scénario, sélectionnez Copier un ou plusieurs tableaux.
  14. Cliquez sur Ajouter des données à partir du projet.
    1. Sélectionnez la connexion Offre d'essai de la matrice de données - Db2 Warehouse .
    2. Sélectionnez le schéma HYPOTHÈSEAI.
    3. Sélectionnez le tableau MORTGAGE_APPLICANTS.
    4. Cliquez sur Sélectionner. Notez que cet actif est reconnu pour inclure des colonnes masquées.
  15. Cliquez sur Définir.
    1. À coté de la colonne ÉTAT, cliquez sur + (signe plus).
    2. Pour la valeur, entrez California.
    3. Cliquez sur Sauvegarder pour enregistrer cette valeur.
    4. Cliquez à nouveau sur Sauvegarder pour revenir à la page Création d'un flux de masquage.
  16. Cliquez sur Create Job.
    1. Pour le Nom, entrez Applicants in California.
    2. Cliquez sur Suivant.
    3. Pour la Connexion cible, sélectionnez la connexion Offre d'essai de matrice de données - Db2 Warehouse.
    4. Pour Schéma cible, sélectionnez BANQUES.
    5. Cliquez sur Suivant pour poursuivre la partition.
  17. Cliquez sur Suivant pour poursuivre l'exécution de la planification.
  18. Cliquez sur Suivant pour poursuivre l'examen.
  19. Cliquez sur Créer et exécuter un travail.
  20. Lorsque l'exécution du travail est terminée, vous pouvez accéder à la base de données cible pour voir les résultats. Regardez la vidéo à XX:XX pour voir à quoi ressemble le tableau dans l'instance Db2 Warehouse .

Etapes suivantes

Vous êtes maintenant prêt à connaître vos données en évaluant, en partageant, en façonnant et en analysant des données dans le tissu de données.Voir le tutoriel Connaître vos données.

En savoir plus

Rubrique parent : Tutoriels sur les matrices de données