0 / 0
Retourner à la version anglaise de la documentation
Cas d'utilisation de la gouvernance des données
Dernière mise à jour : 26 nov. 2024
Cas d'utilisation de la gouvernance des données

De nombreuses entreprises ont du mal à trouver un équilibre entre les avantages de l'accès aux données et la nécessité de protéger les données sensibles. Cloud Pak for Data as a Service fournit les méthodes dont votre entreprise a besoin pour automatiser la gouvernance des données afin que vous puissiez vous assurer que les données sont à la fois accessibles et protégées.

Regardez cette vidéo pour voir le cas d'utilisation de matrice de données pour l'implémentation d'une solution de gouvernance des données dans Cloud Pak for Data.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Défis

De nombreuses entreprises sont confrontées aux défis suivants en matière de gouvernance des données:

Protection de la confidentialité des données à l'échelle
Les organisations doivent se conformer aux règles de confidentialité des données pour les données dans les sources de données sur plusieurs plateformes cloud et sur site.
Accès à des données de haute qualité
Les organisations doivent fournir un accès à des données d'entreprise de haute qualité dans plusieurs équipes.
Création d'un profil client complet
Les équipes doivent créer des vues précises des clients à l'échelle, rapidement, pour optimiser les processus en libre-service et la gestion des données.
Consommation de données en libre-service
Les consommateurs de données, tels que les spécialistes des données, ont du mal à trouver et à utiliser les données dont ils ont besoin.

Vous pouvez résoudre ces problèmes en implémentant une matrice de données avec Cloud Pak for Data as a Service.

Exemple: Les défis de la Golden Bank

Suivez l'histoire de Golden Bank lorsque l'équipe de gouvernance implémente la gouvernance des données. Golden Bank dispose d'une grande quantité de données client et hypothécaire qui inclut des données sensibles. La banque veut s'assurer de la qualité des données, masquer les données sensibles et les mettre à la disposition de plusieurs services.

Processus

La manière dont vous implémentez la gouvernance des données dépend des besoins de votre organisation. Vous pouvez implémenter la gouvernance des données de manière linéaire ou itérative. Vous pouvez vous appuyer sur des fonctions par défaut et des artefacts prédéfinis ou personnaliser votre solution.

Pour implémenter la gouvernance des données, votre organisation peut suivre ce processus:

  1. Etablissement de votre vocabulaire métier
  2. Définissez des règles pour protéger vos données
  3. Organisation et consolidation de vos données
  4. Partager vos données dans des catalogues

Le service IBM Knowledge Catalog dans Cloud Pak for Data fournit les outils et les processus dont votre organisation a besoin pour implémenter une solution de gouvernance des données.

Image illustrant le flux d'actifs dans le cas d'utilisation Gouvernance des données

1. Etablir votre vocabulaire métier

Pour relever les défis, votre équipe doit établir un vocabulaire métier en important ou en créant des artefacts de gouvernance qui agissent en tant que métadonnées pour classer et décrire les données:

  • Avant de pouvoir automatiser la confidentialité des données, votre équipe doit s'assurer que les données à contrôler sont correctement identifiées.
  • Avant de pouvoir analyser la qualité des données, vous devez identifier le format des données.
  • Pour faciliter la recherche de données, votre équipe doit s'assurer que le contenu des données est décrit avec précision.

Dans cette première étape du processus, votre équipe de gouvernance peut s'appuyer sur la base des artefacts de gouvernance prédéfinis et créer des artefacts de gouvernance personnalisés spécifiques à votre organisation. Vous pouvez créer des artefacts pour décrire le format, la signification métier, la sensibilité, la plage de valeurs et les règles de gouvernance des données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catégories Utilisez la catégorie prédéfinie pour stocker vos artefacts de gouvernance.

Créez des catégories pour organiser les artefacts de gouvernance dans une structure hiérarchique similaire aux dossiers.

Ajoutez des collaborateurs avec des rôles qui définissent leurs droits sur les artefacts de la catégorie.
Vous avez besoin de plus que la catégorie prédéfinie.

Vous souhaitez un contrôle à granularité fine des personnes qui peuvent posséder, créer et afficher des artefacts de gouvernance.
flux de travaux Utilisez la configuration de flux de travaux par défaut qui ne restreint pas les personnes qui créent des artefacts de gouvernance ou qui nécessitent des révisions.

Configurez des flux de travaux pour les artefacts de gouvernance et désignez les personnes qui peuvent créer les types d'artefacts de gouvernance dans lesquels les catégories.
Vous souhaitez contrôler qui crée des artefacts de gouvernance.

Vous souhaitez que les brouillons d'artefact de gouvernance soient révisés avant leur publication.
Artefacts de gouvernance Utilisez les termes métier prédéfinis, les classes de données et les classifications.

Créez des artefacts de gouvernance qui agissent en tant que métadonnées pour enrichir, définir et contrôler les actifs de données.
Vous souhaitez ajouter des connaissances et de la signification aux actifs afin d'aider les personnes à comprendre les données.

Vous souhaitez améliorer l'analyse de la qualité des données.
Knowledge Accelerators Importez un ensemble d'artefacts de gouvernance prédéfinis pour améliorer la classification des données, la conformité aux réglementations, l'analyse en libre-service et d'autres opérations de gouvernance. Vous avez besoin d'un vocabulaire standard pour décrire les problèmes métier, les performances métier, les normes de l'industrie et les réglementations.

Vous souhaitez gagner du temps en important des artefacts de gouvernance pré-créés.

Exemple: vocabulaire métier de Golden Bank

Le chef de l'équipe de gouvernance chez Golden Bank commence par créer une catégorie, Banque, pour contenir les artefacts de gouvernance que l'équipe prévoit de créer. Le chef d'équipe ajoute le reste des membres de l'équipe de gouvernance en tant que collaborateurs à la catégorie Banque avec le rôle Editeur afin qu'ils aient le droit de créer des artefacts de gouvernance. Ensuite, le chef d'équipe configure les flux de travaux de sorte qu'un membre d'équipe différent soit responsable de la création de chaque type d'artefact. Tous les flux de travaux nécessitent une étape d'approbation par le chef d'équipe.

Un membre de l'équipe de gouvernance importe un ensemble de termes métier à partir d'une feuille de calcul. Certains des termes de l'entreprise sont associés aux professions des clients personnels. Un autre membre de l'équipe crée un ensemble de données de référence, "Professions", qui contient une liste de professions, où chaque profession possède un numéro d'identification. Un troisième membre de l'équipe crée une classe de données personnalisée, "Profession", pour identifier la profession des clients personnels, en fonction de l'ensemble de données de référence.

2. Définissez des règles pour protéger vos données

Dans l'étape suivante du processus, votre équipe définit des règles pour garantir la conformité aux réglementations en matière de confidentialité des données en contrôlant qui peut voir quelles données. Votre équipe crée des règles de protection des données pour définir comment protéger les données dans les catalogues gouvernés. Votre équipe peut utiliser ces règles de protection des données pour masquer les données sensibles en fonction du contenu, du format ou de la signification des données, ou de l'identité des utilisateurs qui accèdent aux données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Règles de protection des données Protégez les informations sensibles contre les accès non autorisés dans les catalogues gouvernés en refusant l'accès aux données, en masquant les valeurs de données ou en filtrant les lignes dans les actifs de données.

Masquage dynamique et cohérent des données dans les catalogues gouvernés à un niveau granulaire défini par l'utilisateur.
Vous devez appliquer automatiquement la confidentialité des données dans vos catalogues gouvernés.

Vous souhaitez conserver la disponibilité et l'utilité des données tout en vous conformant aux réglementations en matière de confidentialité.
Masquage des flux Utilisez des fonctions avancées de masquage des données préservant le format lorsque vous extrayez des copies ou des sous-ensembles de données de production. Vous avez besoin de données d'entraînement et d'ensembles de tests anonymisés qui conservent l'intégrité des données.
Stratégies et règles de gouvernance Décrivez et documentez les directives, réglementations, normes ou procédures de votre organisation pour la sécurité des données.

Décrivez le comportement ou les actions requis pour implémenter la stratégie de gouvernance.
Vous voulez que les personnes qui utilisent les données comprennent les règles de gouvernance des données.

Exemple: règles de protection des données de Golden Bank

Pour créer un modèle prédictif pour les approbations de prêts hypothécaires, les spécialistes des données de Golden Bank ont besoin d'accéder à des ensembles de données qui incluent des données sensibles. Par exemple, les spécialistes des données veulent accéder à la table avec des données sur les demandeurs d'hypothèque, qui inclut une colonne avec des numéros de sécurité sociale.

Un membre de l'équipe de gouvernance crée une règle de protection des données qui masque les numéros de sécurité sociale. Si la classe de données affectée d'une colonne dans un actif de données est "US Social Security Number", les valeurs de cette colonne sont remplacées par 10 X.

Un membre de l'équipe de gouvernance crée une règle qui inclut la règle de protection des données. La stratégie décrit les raisons métier de l'implémentation de la règle.

3. Organisation des données à partager dans les catalogues

Les intendants de données prennent en compte les actifs de données de haute qualité dans les projets et les publient dans des catalogues où les personnes qui en ont besoin peuvent les trouver. Les intendants de données enrichissent les actifs de données en affectant des artefacts de gouvernance en tant que métadonnées qui décrivent les données et informent la recherche sémantique de données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Metadata import Importez automatiquement les métadonnées techniques pour les données associées à une connexion afin de créer des actifs de données. Vous devez créer de nombreux actifs de données à partir d'une source de données.

Vous devez actualiser les actifs de données que vous avez importés précédemment.
Enrichissement des métadonnées Profilez plusieurs actifs de données en une seule exécution pour affecter automatiquement des classes de données et identifier les types de données et les formats de colonnes.

Affectez automatiquement des termes métier à des actifs et générez des suggestions de termes en fonction de la classification des données.

Exécutez à intervalles réguliers les travaux d'importation et d'enrichissement pour détecter et évaluer les modifications apportées aux actifs de données.
Vous devez organiser et publier de nombreux actifs de données que vous avez importés.
Analyse de la qualité des données Exécutez des vérifications de la qualité des données sur vos ensembles de données afin d'analyser les problèmes de qualité dans vos données.
Suivi continu des modifications apportées au contenu et à la structure des données et analyse récursive des données modifiées.
Vous devez savoir si la qualité de vos données peut affecter l'exactitude de votre analyse de données ou de vos modèles.

Vos utilisateurs doivent identifier les ensembles de données à corriger.

Exemple: curation des données de Golden Bank

Les intendants de données de l'équipe de gouvernance commencent à importer des métadonnées pour créer des actifs de données dans un projet. Après l'importation des métadonnées, Golden Bank dispose de deux actifs de données qui représentent des tables avec une colonne nommée "ID". Après l'enrichissement des métadonnées, ces colonnes sont clairement différenciées par les métadonnées qui leur sont affectées:

  • Une colonne est affectée aux termes métier "Profession" et "Profession", ainsi qu'à la classe de données "Profession".
  • L'autre colonne se voit attribuer les termes métier "Personal identifier" et "Private individu" ainsi que la classe de données "US Social Security Number".

Les intendants de données exécutent une analyse de la qualité des données sur les actifs de données pour s'assurer que le score global de qualité des données dépasse le seuil Golden Bank de 95%.

Le responsable de l'équipe de gouvernance crée un catalogue, "Mortgage Approval Catalog", et ajoute les intendants de données et les spécialistes des données en tant que collaborateurs de catalogue. Les intendants de données publient les actifs de données qu'ils ont créés dans le projet dans le catalogue.

4. Partagez ou utilisez vos données

Le catalogue aide vos équipes à comprendre vos données et à les mettre à disposition pour une utilisation appropriée. Les spécialistes des données et d'autres types d'utilisateurs peuvent s'aider eux-mêmes à obtenir les données dont ils ont besoin tout en restant en conformité avec les politiques d'accès et de protection des données de l'entreprise. Ils peuvent ajouter des actifs de données à partir d'un catalogue dans un projet, où ils collaborent pour préparer, analyser et modéliser les données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catalogs Organisez vos actifs à partager entre les collaborateurs de votre organisation.

Tirez parti de la recherche sémantique basée sur l'intelligence artificielle et des recommandations pour aider les utilisateurs à trouver ce dont ils ont besoin.
Vos utilisateurs doivent facilement comprendre, collaborer, enrichir et accéder aux données de haute qualité.

Vous souhaitez augmenter la visibilité des données et la collaboration entre les utilisateurs métier.

Vous devez permettre aux utilisateurs d'afficher, d'accéder, de manipuler et d'analyser les données sans comprendre leur format physique ou leur emplacement, et sans avoir à les déplacer ou à les copier.

Vous souhaitez que les utilisateurs améliorent les actifs en les notant et en les examinant.
Recherche globale Recherchez des actifs dans tous les projets, catalogues et espaces de déploiement auxquels vous avez accès.

Recherchez des artefacts de gouvernance dans les catégories auxquelles vous avez accès.
Vous devez rechercher des données ou un autre type d'actif ou un artefact de gouvernance.
Data Refinery Nettoyez les données pour corriger ou supprimer les données incorrectes, incomplètes, incorrectement formatées ou dupliquées.

Mettez en forme les données pour les personnaliser en les filtrant, les triant, les combinant ou les supprimant.
Vous devez améliorer la qualité ou l'utilité des données.

Exemple: catalogue de Golden Bank

Les spécialistes des données trouvent les actifs de données dont ils ont besoin dans le catalogue et les copient dans un projet. Dans leur projet, les spécialistes des données peuvent affiner les données pour les préparer à l'entraînement d'un modèle.

Tutoriels sur la gouvernance des données

Tutoriel Descriptif Expertise pour le tutoriel
Organisation de données de haute qualité Créez des actifs de données de haute qualité en enrichissant vos données et en exécutant une analyse de la qualité des données. Exécutez les outils d' Metadata import et d'enrichissement de métadonnées.
Protégez vos données Contrôlez l'accès aux données dans Cloud Pak for Data as a Service. Créez des règles de protection des données.
Consommation de vos données Recherchez, mettez en forme et analysez les données. Explorez un catalogue et exécutez l'outil Data Refinery .
Gouverner les données virtualisées Enrichissez les données virtualisées et assurez-vous que les données virtuelles sont protégées. Utilisez l'interface de Data Virtualization, les projets et les catalogues pour gérer les données virtualisées.

En savoir plus sur la gouvernance des données

Rubrique parent: Cas d'utilisation

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus