0 / 0
Retourner à la version anglaise de la documentation

Cas d'utilisation de l'intelligence des données

Dernière mise à jour : 05 mars 2025
Cas d'utilisation de l'intelligence des données

Ayez confiance en la qualité de vos données et des informations qu'elles génèrent grâce à l'intelligence des données. De nombreuses entreprises ont du mal à trouver un équilibre entre les avantages de l'accès aux données et la nécessité de protéger les données sensibles. Cloud Pak for Data as a Service fournit les méthodes dont votre entreprise a besoin pour automatiser l'intelligence des données afin que vous puissiez vous assurer que les données sont à la fois accessibles et protégées.

La gouvernance des données est un élément essentiel du cas d'utilisation de l'intelligence des données dans l' Cloud Pak for Data. Regardez cette vidéo pour découvrir un cas d'utilisation typique de la gouvernance des données.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Défis

De nombreuses entreprises sont confrontées aux défis suivants en matière de Data Intelligence :

Assurer la confidentialité des données à grande échelle
Les organisations doivent se conformer aux réglementations en matière de confidentialité des données pour les données présentes dans les sources de données sur plusieurs plateformes cloud et sur site.
Accéder aux données des données de haute qualité
Les organisations doivent fournir un accès à des données d'entreprise de haute qualité à plusieurs équipes.
Création d'un profil client complet
Les équipes doivent se faire rapidement une idée précise des clients à grande échelle afin d'optimiser les processus en libre-service et la gestion des données.
Suivi du parcours de vos données
Les équipes doivent garantir la précision, la fiabilité et la conformité en cartographiant le parcours de vos données.
Fournir une consommation de données en libre-service
Les consommateurs de données, tels que les scientifiques des données, ont du mal à trouver et à utiliser les données dont ils ont besoin.

Vous pouvez relever ces défis en mettant en place une structure de données avec l' Cloud Pak for Data as a Service.

Exemple : les défis de la Golden Bank

Suivez l'histoire de Golden Bank alors que l'équipe de gouvernance met en œuvre une solution de Data intelligence. Golden Bank dispose d'un grand nombre de données sur ses clients et ses prêts hypothécaires, dont certaines sont sensibles.La banque souhaite garantir la qualité des données, masquer les données sensibles et les rendre accessibles à plusieurs services.

Processus

La manière dont vous mettez en œuvre la gouvernance des données dépend des besoins de votre organisation. Vous pouvez mettre en œuvre la gouvernance des données de manière linéaire ou itérative. Vous pouvez vous appuyer sur des fonctionnalités par défaut et des artefacts prédéfinis, ou personnaliser votre solution.

Pour mettre en œuvre la gouvernance des données, votre organisation peut suivre le processus suivant :

  1. Établir son vocabulaire professionnel
  2. Définir des règles pour protéger vos données
  3. Organisez et consolidez vos données
  4. Partagez vos données dans des catalogues

Le service d' IBM Knowledge Catalog, disponible sur Cloud Pak for Data, fournit les outils et les processus dont votre organisation a besoin pour mettre en œuvre une solution de Data intelligence.

Image montrant le flux d'actifs dans le cas d'utilisation de l'intelligence des données

1. Établir son vocabulaire professionnel

Pour relever ces défis, votre équipe doit établir un vocabulaire métier en important ou en créant des artefacts de gouvernance qui agissent comme des métadonnées pour classer et décrire les données :

  • Avant de pouvoir automatiser la confidentialité des données, votre équipe doit s'assurer que les données à contrôler sont correctement identifiées.
  • Avant de pouvoir analyser la qualité des données, vous devez identifier leur format.
  • Pour faciliter la recherche des données, votre équipe doit s'assurer que le contenu des données est décrit avec précision.

Dans cette première étape du processus, votre équipe de gouvernance peut s'appuyer sur les artefacts de gouvernance prédéfinis et créer des artefacts de gouvernance personnalisés, spécifiques à votre organisation. Vous pouvez créer des artefacts pour décrire le format, la signification commerciale, la sensibilité, la plage de valeurs et les politiques de gouvernance des données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catégories Utilisez la catégorie prédéfinie pour stocker vos artefacts de gouvernance.

Créez des catégories pour organiser les artefacts de gouvernance dans une structure hiérarchique similaire à des dossiers.

Ajoutez des collaborateurs avec des rôles qui définissent leurs autorisations sur les artefacts de la catégorie.
Vous avez besoin de plus que la catégorie prédéfinie.

Vous souhaitez contrôler précisément qui peut posséder, créer et consulter les artefacts de gouvernance.
flux de travaux Utilisez la configuration par défaut des workflows qui ne restreint pas les personnes autorisées à créer des artefacts de gouvernance et n'impose pas de révisions.

Configurez les workflows pour les artefacts de gouvernance et désignez les personnes autorisées à créer les différents types d'artefacts de gouvernance dans les différentes catégories.
Vous souhaitez contrôler qui crée les artefacts de gouvernance.

Vous souhaitez que les projets d'artefacts de gouvernance soient examinés avant d'être publiés.
Artefacts de gouvernance Utilisez les termes commerciaux, les classes de données et les classifications prédéfinis.

Créez des artefacts de gouvernance qui agissent comme des métadonnées pour enrichir, définir et contrôler les ressources de données.
Vous souhaitez ajouter des connaissances et du sens aux actifs pour aider les gens à comprendre les données.

Vous souhaitez améliorer l'analyse de la qualité des données.
Knowledge Accelerators Importez un ensemble d'artefacts de gouvernance prédéfinis pour améliorer la classification des données, la conformité réglementaire, l'analyse en libre-service et d'autres opérations de gouvernance. Vous avez besoin d'un vocabulaire standard pour décrire les enjeux commerciaux, les performances commerciales, les normes industrielles et les réglementations.

Vous souhaitez gagner du temps en important des artefacts de gouvernance pré-créés.

Exemple : vocabulaire métier de la Banque Golden

Le chef de l'équipe de gouvernance de la Golden Bank commence par créer une catégorie, Banking, pour contenir les artefacts de gouvernance que l'équipe prévoit de créer. Le chef d'équipe ajoute les autres membres de l'équipe de gouvernance en tant que collaborateurs à la catégorie Banque avec le rôle Éditeur afin qu'ils aient la permission de créer des artefacts de gouvernance. Ensuite, le chef d'équipe configure les flux de travail de sorte qu'un membre différent de l'équipe soit responsable de la création de chaque type d'artefact. Tous les flux de travail nécessitent une étape d'approbation par le chef d'équipe.

Un membre de l'équipe de gouvernance importe un ensemble de termes commerciaux à partir d'une feuille de calcul. Certains des termes commerciaux sont associés aux professions des clients personnels. Un autre membre de l'équipe crée un ensemble de données de référence, « Professions », qui contient une liste de professions, où chaque profession a un numéro d'identification. Un troisième membre de l'équipe crée une classe de données personnalisée, « Profession », pour identifier la profession des clients personnels, sur la base de l'ensemble de données de référence.

2. Définir des règles pour protéger vos données

Dans la prochaine étape du processus, votre équipe définit des règles pour assurer la conformité avec les réglementations sur la confidentialité des données en contrôlant qui peut voir quelles données. Votre équipe crée des règles de protection des données pour définir comment protéger les données dans les catalogues gouvernés. Votre équipe peut utiliser ces règles de protection des données pour masquer les données sensibles en fonction du contenu, du format ou de la signification des données, ou de l'identité des utilisateurs qui accèdent aux données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Règles de protection des données Protégez les informations sensibles contre tout accès non autorisé dans les catalogues gouvernés en refusant l'accès aux données, en masquant les valeurs des données ou en filtrant les lignes dans les ressources de données.

Masquez de manière dynamique et cohérente les données dans les catalogues gouvernés à un niveau de granularité défini par l'utilisateur.
Vous devez appliquer automatiquement la confidentialité des données dans tous vos catalogues gérés.

Vous souhaitez conserver la disponibilité et l'utilité des données tout en respectant les réglementations en matière de confidentialité.
Masquage des flux Utilisez des fonctionnalités avancées de masquage des données pour préserver le format lorsque vous extrayez des copies ou des sous-ensembles de données de production. Vous avez besoin de données de formation anonymisées et d'ensembles de tests qui conservent l'intégrité des données.
Politiques et règles de gouvernance Décrivez et documentez les directives, réglementations, normes ou procédures de votre organisation en matière de sécurité des données.

Décrivez le comportement ou les actions requis pour mettre en œuvre la politique de gouvernance.
Vous voulez que les personnes qui utilisent les données comprennent les politiques de gouvernance des données.

Exemple : Règles de protection des données de la Banque Golden

Pour créer un modèle prédictif d'approbation des prêts hypothécaires, les scientifiques de données de la Golden Bank doivent avoir accès à des ensembles de données qui contiennent des données sensibles. Par exemple, les scientifiques des données veulent accéder au tableau contenant les données sur les demandeurs de prêts hypothécaires, qui comprend une colonne avec les numéros de sécurité sociale.

Un membre de l'équipe de gouvernance crée une règle de protection des données qui masque les numéros de sécurité sociale. Si la classe de données affectée à une colonne d'un actif de données est « Numéro de sécurité sociale américain », les valeurs de cette colonne sont remplacées par 10 X.

Un membre de l'équipe de gouvernance crée une politique qui inclut la règle de protection des données. La politique décrit les raisons commerciales de la mise en œuvre de la règle.

3. Organiser les données à partager dans les catalogues

Les gestionnaires de données organisent des ressources de données de haute qualité dans des projets et les publient dans des catalogues où les personnes qui ont besoin des données peuvent les trouver. Les gestionnaires de données enrichissent les actifs de données en attribuant des artefacts de gouvernance en tant que métadonnées qui décrivent les données et informent la recherche sémantique de données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Metadata import Importez automatiquement les métadonnées techniques des données associées à une connexion pour créer des ressources de données. Vous devez créer de nombreuses ressources de données à partir d'une source de données.

Vous devez actualiser les ressources de données que vous avez importées précédemment.
Enrichissement des métadonnées Profiler plusieurs ressources de données en une seule exécution pour attribuer automatiquement des classes de données et identifier les types de données et les formats des colonnes.

Attribuer automatiquement des termes commerciaux aux ressources et générer des suggestions de termes basées sur la classification des données.

Relancez les tâches d'importation et d'enrichissement à intervalles réguliers pour découvrir et évaluer les modifications apportées aux ressources de données.
Vous devez organiser et publier de nombreuses données que vous avez importées.
Analyse de la qualité des données Effectuez des contrôles de qualité sur vos ensembles de données afin de détecter les problèmes de qualité dans vos données.
Suivez en permanence les modifications apportées au contenu et à la structure des données, et analysez régulièrement les données modifiées.
Vous devez savoir si la qualité de vos données peut affecter la précision de vos analyses ou modèles de données.

Vos utilisateurs doivent identifier les ensembles de données à corriger.
Lignage de données Suivez, visualisez, transformez et optimisez votre flux de données de l'origine à la consommation. Vous devez garantir l'exactitude, la fiabilité et la conformité en cartographiant le parcours de vos données.
IBM Match 360 Grâce aux outils de configuration de IBM Match 360, les ingénieurs de données peuvent collecter les données clients de différents systèmes de votre entreprise et visualiser un modèle de données personnalisable généré automatiquement sans avoir à cartographier manuellement des milliers d'attributs.

Une fois vos données chargées dans IBM Match 360, les ingénieurs de données peuvent exécuter un algorithme de correspondance pour créer des entités de données de référence enrichies.
Vous souhaitez utiliser un algorithme de rapprochement intelligent que vous pouvez ajuster et entraîner pour établir une vue unique, fiable et consolidée des données.

Exemple : la curation des données de Golden Bank

Les gestionnaires de données de l'équipe de gouvernance commencent à importer des métadonnées pour créer des ressources de données dans un projet. Après l'importation des métadonnées, Golden Bank dispose de deux ressources de données qui représentent des tableaux dont une colonne est nommée « ID ». Après enrichissement des métadonnées, ces colonnes sont clairement différenciées par les métadonnées qui leur sont attribuées :

  • Une colonne est affectée aux termes commerciaux « Occupation » et « Profession », et à la classe de données « Profession ».
  • L'autre colonne est affectée aux termes commerciaux « Identifiant personnel » et « Particulier » et à la classe de données « Numéro de sécurité sociale américain ».

Les gestionnaires de données effectuent une analyse de la qualité des données sur les actifs de données pour s'assurer que le score global de qualité des données dépasse le seuil de 95 % de la Banque d'or.

Le chef de l'équipe de gouvernance crée un catalogue, « Catalogue d'approbation des prêts hypothécaires », et ajoute les gestionnaires de données et les scientifiques des données en tant que collaborateurs du catalogue. Les gestionnaires de données publient dans le catalogue les ressources de données qu'ils ont créées dans le projet.

4. Partagez ou travaillez avec vos données

Le catalogue aide vos équipes à comprendre vos données et met les bonnes données à disposition pour la bonne utilisation. Les scientifiques des données et les autres types d'utilisateurs peuvent se servir des données dont ils ont besoin tout en respectant les politiques d'accès et de protection des données de l'entreprise. Ils peuvent ajouter des données d'un catalogue à un projet, où ils collaborent pour préparer, analyser et modéliser les données.

Ce que vous pouvez utiliser Fonction A utiliser de préférence lorsque
Catalogs Organisez vos ressources pour les partager entre les collaborateurs de votre organisation.

Tirez parti de la recherche sémantique et des recommandations basées sur l'IA pour aider les utilisateurs à trouver ce dont ils ont besoin.
Vos utilisateurs doivent pouvoir facilement comprendre, enrichir et accéder aux données de haute qualité, et collaborer à leur sujet.

Vous souhaitez accroître la visibilité des données et la collaboration entre les utilisateurs professionnels.

Vous avez besoin que les utilisateurs puissent visualiser, accéder, manipuler et analyser les données sans comprendre leur format physique ou leur emplacement, et sans avoir à les déplacer ou à les copier.

Vous souhaitez que les utilisateurs améliorent les ressources en les évaluant et en les examinant.
Recherche globale Rechercher des actifs dans tous les projets, catalogues et espaces de déploiement auxquels vous avez accès.

Rechercher des artefacts de gouvernance dans toutes les catégories auxquelles vous avez accès.
Vous devez trouver des données ou un autre type d'actif, ou un artefact de gouvernance.
Data Product Hub Partager des produits de données; les producteurs de données peuvent publier des produits de données sélectionnés à partager avec les consommateurs de données de leur communauté, et les consommateurs de données peuvent facilement accéder aux produits de données pour répondre aux besoins de leur entreprise. Vous devez regrouper, produire et partager vos ressources riches en données.
Data Refinery Nettoyer les données pour corriger ou supprimer les données incorrectes, incomplètes, mal formatées ou dupliquées.

Mettre en forme les données pour les personnaliser en filtrant, triant, combinant ou supprimant des colonnes.
Vous devez améliorer la qualité ou l'utilité des données.

Exemple : le catalogue de la Banque Golden

Les scientifiques des données trouvent les ressources de données dont ils ont besoin dans le catalogue et les copient dans un projet. Dans leur projet, les scientifiques des données peuvent affiner les données pour les préparer à l'apprentissage d'un modèle.

Tutoriels pour Data intelligence

Tutoriel Descriptif Expertise pour le tutoriel
Conserver des données de haute qualité Créez des ressources de données de haute qualité en enrichissant vos données et en effectuant une analyse de la qualité des données. Exécuter les outils d'enrichissement de l' Metadata import s et des métadonnées.
Protégez vos données Contrôlez l'accès aux données sur l'ensemble de l' Cloud Pak for Data as a Service. Créer des règles de protection des données.
Consommez vos données Rechercher, organiser et analyser des données. Explorez un catalogue et lancez l'outil d' Data Refinery.
Gouverner les données virtualisées Enrichir les données virtualisées et s'assurer que les données virtuelles sont protégées. Utilisez l'interface, les projets et les catalogues d' Data Virtualization s pour gérer les données virtualisées.
Configuration d'une vue à 360 degrés Configurez, cartographiez et modélisez vos données pour créer une vue consolidée de vos clients. Utilisez l'interface glisser-déposer d' Match 360 pour configurer votre vue consolidée.

En savoir plus sur l'intelligence des données

Sujet parent : Cas d'utilisation