Pour ajouter des données au référentiel de lignage, vous devez sélectionner l'instance Cloud Object Storage, créer une définition de source de données et créer une importation de métadonnées.
Droit requis
Vous devez disposer des droits d'utilisateur suivants :
- Gérer l'historique des données
Prérequis
La fonction de lignage des données n'est pas disponible par défaut. Vous devez installer le service IBM Knowledge Catalog avec le service IBM Manta Data Lineage activé. Pour plus d'informations sur l'activation du lignage des données, voir Activer le lignage des données.
Vous avez besoin d'un projet pour stocker les métadonnées importées pour les ressources de données. Pour plus d'informations, voir Création d'un projet.
Configuration du lignage des données
Sélectionnez l'instance de Cloud Object Storage pour stocker les métadonnées de lignage de données. Vous ne pouvez sélectionner votre instance de stockage qu'une seule fois. Vous ne pouvez pas le modifier ultérieurement. Assurez-vous que le stockage d'objets est configuré pour permettre aux utilisateurs de créer des catalogues et des projets. Voir Configuration de IBM Cloud Object Storage pour une utilisation avec Cloud Pak for Data en tant que service.
Pour définir le stockage :
- Allez à la page Configurations et paramètres ou Lignage de données et cliquez sur Configuration du lignage de données.
- Sélectionnez votre stockage dans la liste et enregistrez vos modifications.
Préparation des données pour alimenter le référentiel de lignage
Avant de visualiser le lignage, vous devez alimenter votre référentiel de lignage de données de la manière suivante :
- Créer une définition de source de données et une connexion.
Une définition de source de données est un actif qui fonctionne comme un identifiant unique et stable pour l'emplacement d'une source de données telle qu'une base de données relationnelle. Les définitions des sources de données utilisent des points de terminaison pour identifier la source de données. Pour la plupart des types de sources de données, un point d'accès est la combinaison du nom d'hôte ou de l'adresse IP, du numéro de port et du nom de la base de données ou de l'identifiant de l'instance. Pour plus d'informations et une procédure, voir Création d'une définition de source de données à partir de la liste des définitions de sources de données.
Une connexion est utilisée pour se connecter à la source de données externe. Voir Ajouter des connexions de plate-forme. Pour consulter la liste des connecteurs pris en charge pour le lignage de données, voir Sources de données prises en charge pour le lignage de données.
L'affectation de la connexion à une définition de source de données se fait automatiquement. Lors de la création d'une connexion, puis d'une définition de source de données, l'affectation peut prendre plus de temps.
- Naviguez vers votre projet et créez une importation de métadonnées. Pour plus d'informations, voir Création d'une ressource d'importation de métadonnées et importation de métadonnées.
- Une fois l'importation des métadonnées réussie, allez dans l'onglet 'Données > Lignage des données > Lignage des vues pour vérifier si vos données sont visibles dans l'arborescence du référentiel.
En savoir plus
- Protection des données grâce à la définition des sources de données
- Importation de métadonnées
- Sources de données prises en charge pour la curation et la qualité des données
- Visualisation de l'historique des données
- Gérer le lignage des données
Sujet parent : Lignage des données