0 / 0
Retourner à la version anglaise de la documentation
Cas d'utilisation de la gouvernance des données et de la confidentialité
Cas d'utilisation de la gouvernance des données et de la confidentialité

Cas d'utilisation de la gouvernance des données et de la confidentialité

De nombreuses entreprises ont du mal à trouver un équilibre entre les avantages de l'accès aux données et la nécessité de protéger les données sensibles. Cloud Pak for Data as a Service fournit les méthodes dont votre entreprise a besoin pour automatiser la gouvernance et la confidentialité des données afin que vous puissiez vous assurer que les données sont à la fois accessibles et protégées.

Regardez cette vidéo pour voir le cas d'utilisation de matrice de données pour l'implémentation d'une solution de Data governance and privacy dans Cloud Pak for Data.

Cette vidéo constitue une alternative visuelle aux procédures figurant dans cette documentation.

Questions secrètes

De nombreuses entreprises sont confrontées aux défis suivants en matière de gouvernance des données et de protection de la vie privée:

Fournir la confidentialité des données à l'échelle
Les organisations doivent se conformer aux réglementations de confidentialité des données pour les données dans les sources de données sur plusieurs plateformes cloud et sur site.

Accès à des données de haute qualité
Les organisations doivent fournir un accès à des données d'entreprise de haute qualité dans plusieurs équipes.

Consommation de données en libre-service
Les consommateurs de données, tels que les spécialistes des données, ont du mal à trouver et à utiliser les données dont ils ont besoin.

Vous pouvez résoudre ces problèmes en implémentant une matrice de données avec Cloud Pak for Data as a Service.

Exemple: Les défis de la Golden Bank

Suivez l'histoire de Golden Bank lorsque l'équipe de gouvernance implémente la gouvernance des données. Golden Bank dispose d'une grande quantité de données client et hypothécaire qui inclut des données sensibles. La banque veut s'assurer de la qualité des données, masquer les données sensibles et les mettre à la disposition de plusieurs services.

Processus

Pour implémenter la gouvernance et la confidentialité des données, votre organisation peut suivre ce processus:

  1. Configurer une infrastructure de gouvernance
  2. Créez des règles pour protéger vos données
  3. Organisation des données à partager dans les catalogues
  4. Rechercher et utiliser des données

Le service Watson Knowledge Catalog dans Cloud Pak for Data as a Service fournit tous les outils et processus dont votre organisation a besoin pour implémenter une solution de gouvernance et de confidentialité des données.

Image illustrant le flux d'actifs dans le cas d'utilisation de gouvernance et de confidentialité des données

1. Configuration d'une infrastructure de gouvernance

Pour répondre aux trois défis, votre équipe doit configurer une infrastructure d'artefacts de gouvernance qui agissent en tant que métadonnées pour classer et décrire les données:

  • Avant de pouvoir automatiser la confidentialité des données, votre équipe doit s'assurer que les données à contrôler sont correctement identifiées.
  • Avant de pouvoir analyser la qualité des données, vous devez identifier le format des données.
  • Pour faciliter la recherche de données, votre équipe doit s'assurer que le contenu des données est décrit avec précision.

Dans cette première étape du processus, votre équipe de gouvernance peut s'appuyer sur la base des artefacts de gouvernance prédéfinis et créer des artefacts de gouvernance personnalisés spécifiques à votre organisation. Vous pouvez créer des artefacts pour décrire le format, la signification métier, la sensibilité, la plage de valeurs et les règles de gouvernance des données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catégories Utilisez la catégorie prédéfinie pour stocker vos artefacts de gouvernance.

Créez des catégories pour organiser les artefacts de gouvernance dans une structure hiérarchique similaire aux dossiers.

Ajoutez des collaborateurs avec des rôles qui définissent leurs droits sur les artefacts de la catégorie.
Vous avez besoin de plus que la catégorie prédéfinie.

Vous souhaitez un contrôle à granularité fine des personnes qui peuvent posséder, créer et afficher des artefacts de gouvernance.
Flux de travaux Utilisez la configuration de flux de travaux par défaut qui ne restreint pas les personnes qui créent des artefacts de gouvernance ou qui nécessitent des révisions.

Configurez des flux de travaux pour les artefacts de gouvernance et désignez les personnes qui peuvent créer les types d'artefacts de gouvernance dans lesquels les catégories.
Vous souhaitez contrôler qui crée des artefacts de gouvernance.

Vous souhaitez que les brouillons d'artefact de gouvernance soient révisés avant leur publication.
Artefacts de gouvernance Utilisez les classes de données et les classifications prédéfinies.

Créez des artefacts de gouvernance qui servent de métadonnées pour enrichir, définir et contrôler les actifs de données.
Vous souhaitez ajouter des connaissances et de la signification aux actifs afin d'aider les personnes à comprendre les données.

Vous souhaitez améliorer l'analyse de la qualité des données.
Knowledge Accelerators Importez un ensemble d'artefacts de gouvernance prédéfinis pour améliorer la classification des données, la conformité aux réglementations, l'analyse en libre-service et d'autres opérations de gouvernance. Vous avez besoin d'un vocabulaire standard pour décrire les problèmes métier, les performances métier, les normes de l'industrie et les réglementations.

Vous souhaitez gagner du temps en important des artefacts de gouvernance pré-créés.


Exemple: Cadre de gouvernance de la Golden Bank

Le chef de l'équipe de gouvernance chez Golden Bank commence par créer une catégorie, Banque, pour contenir les artefacts de gouvernance que l'équipe prévoit de créer. Le chef d'équipe ajoute le reste des membres de l'équipe de gouvernance en tant que collaborateurs à la catégorie Banque avec le rôle Editeur afin qu'ils aient le droit de créer des artefacts de gouvernance. Ensuite, le chef d'équipe configure les flux de travaux de sorte qu'un membre d'équipe différent soit responsable de la création de chaque type d'artefact. Tous les flux de travaux nécessitent une étape d'approbation par le chef d'équipe.

Un membre de l'équipe de gouvernance importe un ensemble de termes métier à partir d'une feuille de calcul. Certains des termes de l'entreprise font la différence entre les clients personnels et commerciaux. Un autre membre de l'équipe crée un jeu de données de référence, "Diamond-level client names", qui contient une liste des principaux clients commerciaux. Un troisième membre de l'équipe crée une classe de données personnalisée, "Diamond-level clients", pour identifier les principaux clients commerciaux, en fonction du jeu de données de référence.

2. Créez des règles pour protéger vos données

Au cours de l'étape suivante du processus, votre équipe configure des règles pour garantir la conformité aux règles de confidentialité des données en contrôlant qui peut voir quelles données. Votre équipe crée des règles de protection des données qui protègent les données sur l'ensemble de la plateforme. Votre équipe peut utiliser ces règles de protection des données pour masquer les données sensibles en fonction du contenu, du format ou de la signification des données, ou de l'identité des utilisateurs qui accèdent aux données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Règles de protection des données Protégez les informations sensibles des accès non autorisés en refusant l'accès ou en masquant les valeurs de données dans les actifs de données.

Masquage dynamique et cohérent des données à un niveau granulaire défini par l'utilisateur.
Vous devez appliquer automatiquement la confidentialité des données sur l'ensemble de la plateforme.

Vous souhaitez conserver la disponibilité et l'utilité des données tout en respectant les réglementations en matière de confidentialité.
Masquage des flux Utilisez des fonctions avancées de masquage des données préservant le format lorsque vous extrayez des copies ou des sous-ensembles de données de production. Vous avez besoin de données d'entraînement et d'ensembles de tests anonymisés qui conservent l'intégrité des données.
Stratégies et règles de gouvernance Décrivez et documentez les directives, réglementations, normes ou procédures de votre organisation pour la sécurité des données.

Décrivez le comportement ou les actions requis pour implémenter la stratégie de gouvernance.
Vous voulez que les personnes qui utilisent les données comprennent les règles de gouvernance des données.


Exemple: règles de protection des données de Golden Bank

Pour créer un modèle prédictif pour les approbations de prêts hypothécaires, les spécialistes des données de Golden Bank ont besoin d'accéder à des ensembles de données qui incluent des données sensibles. Par exemple, les spécialistes des données veulent accéder à la table avec des données sur les demandeurs d'hypothèque, qui inclut une colonne avec des numéros de sécurité sociale.

Un membre de l'équipe de gouvernance crée une règle de protection des données qui masque les numéros de sécurité sociale. Si la classe de données affectée d'une colonne dans un actif de données est "US Social Security Number", les valeurs de cette colonne sont remplacées par 10 X.

Un membre de l'équipe de gouvernance crée une règle qui inclut la règle de protection des données. La stratégie décrit les raisons métier de l'implémentation de la règle. Par la suite, lorsque des utilisateurs, tels que des spécialistes des données, voient l'icône masquée dans une colonne de données, ils peuvent afficher la règle de protection des données, puis afficher la politique associée pour comprendre pourquoi les données sont masquées.

3. Organisation des données à partager dans les catalogues

Les intendants de données prennent en compte les actifs de données de haute qualité dans les projets et les publient dans des catalogues où les personnes qui en ont besoin peuvent les trouver. Les intendants de données enrichissent les actifs de données en affectant des artefacts de gouvernance en tant que métadonnées qui décrivent les données et informent la recherche sémantique de données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Metadata import Importez automatiquement les métadonnées techniques pour les données associées à une connexion afin de créer des actifs de données. Vous devez créer de nombreux actifs de données à partir d'une source de données.

Vous devez actualiser les actifs de données que vous avez importés précédemment.
Enrichissement des métadonnées Profilez plusieurs actifs de données en une seule exécution pour affecter automatiquement des classes de données et identifier les types de données et les formats de colonnes.

Affectez automatiquement des termes métier à des actifs et générez des suggestions de termes en fonction de la classification des données.

Exécutez à intervalles réguliers les travaux d'importation et d'enrichissement pour détecter et évaluer les modifications apportées aux actifs de données.
Vous devez organiser et publier de nombreux actifs de données que vous avez importés.
Analyse de la qualité des données Exécutez une analyse de la qualité sur plusieurs jeux de données en une seule exécution pour rechercher des dimensions communes de la qualité des données, telles que les valeurs manquantes ou les violations de classe de données.
Suivi continu des modifications apportées au contenu et à la structure des données, et analyse de manière récursive les données modifiées.
Vous devez savoir si la qualité de vos données peut affecter l'exactitude de votre analyse de données ou de vos modèles.

Vos utilisateurs doivent identifier les ensembles de données à corriger.
Catalogues Publiez des actifs organisés à partager entre les collaborateurs de votre organisation. Vous avez besoin d'un référentiel central pour stocker les actifs de données qui affichent les métadonnées, les relations et l'historique associés des actifs.


Exemple: curation des données de Golden Bank

Les intendants de données de l'équipe de gouvernance commencent à importer des métadonnées pour créer des actifs de données dans un projet. Après l'importation des métadonnées, Golden Bank dispose de deux actifs de données qui représentent des tables avec une colonne nommée "ID". Après l'enrichissement des métadonnées, ces colonnes sont clairement différenciées par les métadonnées qui leur sont affectées:

  • Une colonne est affectée aux termes métier "Commercial client" et "Company identifier", ainsi qu'à la classe de données "Diamond-level clients".
  • L'autre colonne se voit attribuer les termes métier "Personal identifier" et "Private individu" ainsi que la classe de données "US Social Security Number".

Les intendants de données exécutent une analyse de la qualité des données sur les actifs de données pour s'assurer que le score global de qualité des données dépasse le seuil Golden Bank de 95%.

Le responsable de l'équipe de gouvernance crée un catalogue, "Mortgage Approval Catalog", et ajoute les intendants de données et les spécialistes des données en tant que collaborateurs de catalogue. Les intendants de données publient les actifs de données qu'ils ont créés dans le projet dans le catalogue.

4. Rechercher et utiliser les données

Le catalogue aide vos équipes à comprendre vos données et à les mettre à disposition pour une utilisation appropriée. Les spécialistes des données et d'autres types d'utilisateurs peuvent s'aider eux-mêmes à obtenir les données dont ils ont besoin tout en restant en conformité avec les politiques d'accès et de protection des données de l'entreprise. Ils peuvent ajouter des actifs de données à partir d'un catalogue dans un projet, où ils collaborent pour préparer, analyser et modéliser les données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catalogues Organisez vos actifs à partager entre les collaborateurs de votre organisation.

Tirez parti de la recherche sémantique basée sur l'intelligence artificielle et des recommandations pour aider les utilisateurs à trouver ce dont ils ont besoin.
Vos utilisateurs doivent facilement comprendre, collaborer, enrichir et accéder aux données de haute qualité.

Vous souhaitez augmenter la visibilité des données et la collaboration entre les utilisateurs métier.

Vous devez permettre aux utilisateurs d'afficher, d'accéder, de manipuler et d'analyser les données sans comprendre leur format physique ou leur emplacement, et sans avoir à les déplacer ou à les copier.

Vous souhaitez que les utilisateurs améliorent les actifs en les notant et en les examinant.
Recherche globale Recherchez des actifs dans tous les projets, catalogues et espaces de déploiement auxquels vous avez accès.

Recherchez des artefacts de gouvernance dans les catégories auxquelles vous avez accès.
Vous devez rechercher des données ou un autre type d'actif ou un artefact de gouvernance.
Data Refinery Nettoyez les données pour corriger ou supprimer les données incorrectes, incomplètes, incorrectement formatées ou dupliquées.

Mettez en forme les données pour les personnaliser en les filtrant, les triant, les combinant ou les supprimant.
Vous devez améliorer la qualité ou l'utilité des données.


Exemple: catalogue de Golden Bank

Les spécialistes des données trouvent les actifs de données dont ils ont besoin dans le catalogue et les copient dans un projet. Dans leur projet, les spécialistes des données peuvent affiner les données pour les préparer à l'entraînement d'un modèle.

Tutoriels sur la confidentialité et la gouvernance des données

Tutoriel Description Expertise pour le tutoriel
Faites confiance à vos données Créez des actifs de données de confiance en enrichissant vos données et en exécutant une analyse de la qualité des données. Exécutez les outils d' Metadata import et d'enrichissement de métadonnées.
Protégez vos données Contrôlez l'accès aux données dans Cloud Pak for Data as a Service. Créez des règles de protection des données.
Connaître vos données Evaluer, partager, façonner et analyser les données. Explorez un catalogue et exécutez l'outil Data Refinery .
Gouverner les données virtualisées Enrichissez les données virtualisées et assurez-vous que les données virtuelles sont protégées. Utilisez l'interface Watson Query , les projets et les catalogues pour gouverner les données virtualisées.


En savoir plus sur la confidentialité et la gouvernance des données

Rubrique parent: Présentation de la solution de matrice de données