Préparer les données pour le lignage des données

Dernière mise à jour : 15 avr. 2025
Préparer les données pour le lignage des données

Pour ajouter des données au référentiel de lignage, vous devez sélectionner l'instance Cloud Object Storage, créer la définition de la source de données et créer l'importation des métadonnées.

Droit requis

Vous devez disposer des droits d'utilisateur suivants :

  • Gérer la traçabilité des données

Prérequis

La fonction de lignage des données n'est pas disponible par défaut. Vous devez installer le service IBM Knowledge Catalog avec le service IBM Manta Data Lineage activé. Pour plus d'informations sur l'activation du lignage des données, voir Activer le lignage des données.

Vous avez besoin d'un projet pour stocker les métadonnées importées pour les ressources de données. Pour plus d'informations, voir Création d'un projet.

Configuration du lignage des données

Sélectionnez l'instance de Cloud Object Storage pour stocker les métadonnées de lignage de données. Vous ne pouvez sélectionner votre instance de stockage qu'une seule fois. Vous ne pouvez pas le modifier ultérieurement. Assurez-vous que le stockage d'objets est configuré pour permettre aux utilisateurs de créer des catalogues et des projets. Voir Configuration de IBM Cloud Object Storage pour une utilisation avec Cloud Pak for Data en tant que service.

Pour définir le stockage :

  1. Allez à la page Configurations et paramètres ou Lignage de données et cliquez sur Configuration du lignage de données.
  2. Sélectionnez votre stockage dans la liste et enregistrez vos modifications.

Préparation des données pour alimenter le référentiel de lignage

Avant de visualiser le lignage, vous devez alimenter votre référentiel de lignage de données de la manière suivante :

  1. Créer une définition de source de données et une connexion.

Une définition de source de données est un actif qui fonctionne comme un identifiant unique et stable pour l'emplacement d'une source de données telle qu'une base de données relationnelle. Les définitions des sources de données utilisent des points de terminaison pour identifier la source de données. Pour la plupart des types de sources de données, un point d'accès est la combinaison du nom d'hôte ou de l'adresse IP, du numéro de port et du nom de la base de données ou de l'identifiant de l'instance. Pour plus d'informations et une procédure, voir Création d'une définition de source de données à partir de la liste des définitions de sources de données.

Une connexion est utilisée pour se connecter à la source de données externe. Voir Ajouter des connexions de plate-forme. Pour consulter la liste des connecteurs pris en charge pour le lignage de données, voir Connecteurs pris en charge pour l'importation de lignage.

L'affectation de la connexion à une définition de source de données se fait automatiquement. Lors de la création d'une connexion, puis d'une définition de source de données, l'affectation peut prendre plus de temps.

  1. Naviguez vers votre projet et créez une importation de métadonnées. Pour plus d'informations, voir Création d'une ressource d'importation de métadonnées et importation de métadonnées.
  2. Une fois l'importation des métadonnées réussie, allez dans l'onglet 'Données > Lignage des données > Lignage des vues pour vérifier si vos données sont visibles dans l'arborescence du référentiel.

En savoir plus

Sujet parent : Lignage des données