0 / 0
Retourner à la version anglaise de la documentation
Création d'importations de métadonnées
Dernière mise à jour : 05 juil. 2024
Création d'importations de métadonnées

Vous pouvez importer des métadonnées techniques pour ajouter des actifs de données à un projet ou à un catalogue. Dans un projet, vous pouvez préparer et analyser les données avant de les publier dans un catalogue.

Importez des métadonnées dans un projet en tant qu'actifs de données pour préparer et analyser les données avant de les publier dans un catalogue. Profilez ces actifs de données, analysez la qualité des données et affectez des termes pour fournir un contexte métier en exécutant l'enrichissement des métadonnées. Pour effectuer une analyse de qualité plus approfondie, exécutez des règles de qualité de données sur les actifs de données. Vous pouvez également ajouter des actifs de données à un catalogue directement si les données sont prêtes à être partagées sans préparation supplémentaire.

Vous pouvez utiliser des API à la place de l'interface utilisateur pour extraire la liste des connexions prises en charge ou pour créer un actif d'importation de métadonnées. Les liens vers ces API sont répertoriés dans la section En savoir plus .

Types d'actif

Actifs de données représentant des tables ou des fichiers d'une connexion à une source de données externe.

Remarque: pour les classeurs Microsoft Excel, chaque feuille est importée en tant qu'actif de données distinct. Le nom de l'actif de données est égal au nom de la feuille Excel.

Connexions prises en charge

Voir la colonne Metadata import dans Connecteurs pris en charge.

Autorisations requises

Pour créer, gérer et exécuter une importation de métadonnées, vous devez disposer des rôles et des droits suivants:

  • Le rôle Admin ou Editeur dans le projet.
  • Le rôle Admin ou Editeur dans le catalogue dans lequel vous souhaitez importer ou publier les actifs.
  • Accès aux connexions aux sources de données des actifs de données à importer et au droit SELECT ou à un droit similaire sur les bases de données correspondantes.

Présentation

L'importation de métadonnées pour la reconnaissance implique le processus suivant:

  • Identifiez la source de données à partir de laquelle vous souhaitez effectuer l'importation. Il se peut qu'une connexion à cette source de données soit déjà définie. Sinon, vérifiez que vous disposez des données d'identification pour vous connecter à cette source de données. Pour la liste des connexions prises en charge, voir Connecteurs pris en charge.
  • Dans un projet, créez un actif d'importation de métadonnées pour configurer les détails d'importation tels que la portée et la cible de l'importation et la planification du travail d'importation.
  • Importez des actifs dans le projet ou le catalogue. Lorsque vous accédez à un actif de données importé, les données sont extraites dynamiquement de la source de données.
  • Analysez et prévisualisez les métadonnées que vous avez importées dans un projet et partagez-les dans le catalogue. Vous pouvez créer des profils pour des actifs individuels un à la fois à partir de l'onglet Profil de chaque actif. Vous pouvez également créer des profils pour plusieurs actifs de données en parallèle et y ajouter un contexte métier en créant et en exécutant un Actif d'enrichissement de métadonnées.

Regardez cette courte vidéo pour voir comment importer des métadonnées d'actif d'une source externe dans un projet.

Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.

Création d'un actif d'importation de métadonnées et importation de métadonnées

Pour créer un actif d'importation de métadonnées et un travail d'importation de métadonnées dans un projet ou un catalogue:

  1. Ouvrez un projet, allez dans la page du projet Actif page et cliquez Nouvel actif > Importer des métadonnées pour les actifs de données .

  2. Spécifiez un nom pour l'importation de métadonnées. Vous pouvez éventuellement fournir une description.

  3. Facultatif: sélectionnez les balises à affecter à l'actif d'importation de métadonnées pour simplifier la recherche. Vous pouvez créer une nouvelle étiquette en entrant son nom et en appuyant sur Entrée.

  4. Sélectionnez la cible de l'importation. Vous pouvez importer des métadonnées dans le projet dans lequel vous travaillez ou dans n'importe quel catalogue dont vous êtes membre.

    Importez les métadonnées dans un projet pour analyse avant de déterminer les actifs qui seront partagés avec un catalogue pour que d'autres utilisateurs puissent les utiliser. Dans un projet, vous pouvez exécuter des règles d'enrichissement de métadonnées et de qualité de données sur les actifs de données importés.

    Si vous connaissez bien le contenu des actifs de données, vous pouvez importer leurs métadonnées directement dans le catalogue.

    Si votre projet est marqué comme sensible, vous pouvez l'importer uniquement dans le projet et non dans un catalogue.

  5. Définissez une portée pour l'importation de métadonnées.

    1. Sélectionnez un actif de connexion existant comme source des données, ou cliquez sur Créer une connexion et Créer un actif de connexion. Vous pouvez importer des métadonnées à partir des sources de données répertoriées dans Connecteurs pris en charge.

    2. Sélectionnez les éléments à inclure dans l'importation et cliquez sur Sélectionner. Selon la taille et le contenu de votre source de données, vous ne souhaiterez peut-être pas importer tous les actifs, mais un sous-ensemble sélectionné. Vous pouvez inclure des schémas ou dossiers complets, ou passer au niveau inférieur vers des tables ou fichiers individuels. Lorsque vous sélectionnez un schéma ou un dossier, vous pouvez immédiatement voir le nombre d'éléments qu'il contient. Ainsi, vous pouvez décider si vous souhaitez inclure tout l'ensemble ou si un sous-ensemble est plus approprié.

      Notez que vous ne pouvez pas importer de données à partir de schémas dont le nom contient des caractères spéciaux.

    3. Vérifiez la portée sélectionnée. Vous pouvez supprimer directement des actifs de la portée de données ou retravailler la portée entière en cliquant sur Éditer la portée des données. Lorsque vous avez terminé d'affiner la portée des données, cliquez sur Suivant.

  6. Indiquez si vous souhaitez exécuter des travaux d'importation planifiés. Si vous ne définissez pas de calendrier, vous exécutez l'importation lorsque vous enregistrez l'actif d'importation de métadonnées. Vous pouvez réexécuter l'importation manuellement à tout moment. Si vous choisissez d'exécuter l'importation selon une planification spécifique, définissez la date et l'heure de l'exécution du travail. Vous pouvez planifier des exécutions uniques et récurrentes. Si vous planifiez une exécution unique, le travail s'exécute exactement une fois au jour et à l'heure indiqués. Si vous planifiez des exécutions récurrentes, le travail s'exécute pour la première fois à l'horodatage indiqué dans la section Répéter .

    Vous pouvez éventuellement modifier le nom du travail d'importation. Le nom par défaut est le travail Nom_importation_métadonnées.

    Vous pouvez ensuite accéder au travail d'importation que vous créez à partir de l'actif d'importation de métadonnées ou à partir de la page Travaux du projet. Voir Travaux.

  7. Facultatif. Personnalisez le comportement d'importation. Vous pouvez choisir d'empêcher la mise à jour de propriétés spécifiques et de supprimer les actifs existants qui ne sont pas inclus dans la réimportation.

    Mettre à jour lors de la réimportation
    Par défaut, toutes les propriétés d'actif sont mises à jour lorsque des actifs sont réimportés. Si vous ne souhaitez pas que les noms d'actif, les descriptions d'actif ou les descriptions de colonne soient mis à jour lors de la réimportation, décochez les cases correspondantes.
    Supprimer lors de la réimportation
    Par défaut, aucun actif n'est supprimé du projet ou du catalogue cible lorsque vous réexécutez l'importation. Pour nettoyer le projet ou le catalogue cible, vous pouvez choisir de supprimer les actifs qui ne sont plus disponibles dans la source de données ou les actifs qui ont été supprimés de la portée d'importation lors de la réimportation.
    Exclure de l'importation
    Pour les importations de métadonnées que vous exécutez sur des bases de données relationnelles, vous pouvez choisir d'importer tous les types d'actifs relationnels ou d'exclure des tables, des vues, des alias et des synonymes. Ces options s'excluent mutuellement.
    Importer des propriétés supplémentaires
    Pour les importations de métadonnées que vous exécutez sur des bases de données relationnelles, vous pouvez indiquer si les clés primaires et externes qui peuvent être définies dans la base de données sont importées.

    Options d'importation supplémentaires:

    La mise à jour ou la suppression de la description d'un actif dans la source de données ne modifie pas la date de modification de l'actif. La date de modification ne change pas non plus pour les actifs supprimés de la liste des actifs importés. Par conséquent, ces actifs ne sont pas pris en considération pour les importations supplémentaires. En outre, les actifs qui sont supprimés de la source de données ou de la portée ne sont pas détectés avec des importations incrémentielles. Par conséquent, ces actifs ne sont pas marqués comme supprimés ou supprimés comme indiqué dans les paramètres Supprimer lors de la réimportation . Pour que ces modifications soient prises en compte, désactivez les importations incrémentielles pour réimporter tous les actifs de la portée de données.

    important: Les importations incrémentielles peuvent ne pas fonctionner si la source de données et l'emplacement à partir duquel vous accédez à votre compte Cloud Pak for Data se trouvent dans des fuseaux horaires différents. Si vous accédez à votre compte Cloud Pak for Data dans un fuseau horaire qui est en avance sur le fuseau horaire de la source de données, le travail d'importation de métadonnées risque de ne pas détecter les actifs qui ont été ajoutés ou modifiés après la dernière exécution de l'importation. Dans ce cas, désactivez l'importation incrémentielle pour que tous les actifs soient inclus lorsque vous réexécutez l'importation.
    Pour que les importations incrémentielles fonctionnent, la source de données doit être dans le fuseau horaire GMT, quel que soit le fuseau horaire du compte Cloud Pak for Data .
    • Collectez des métadonnées à partir du catalogue de base de données
      Pour les importations de métadonnées que vous exécutez sur des bases de données relationnelles, vous pouvez choisir d'importer des métadonnées à partir du catalogue de base de données. Par conséquent, l'utilisateur qui exécute l'importation doit uniquement accéder au catalogue de la base de données, mais il n'a pas besoin de disposer du droit SELECT sur les données réelles. Les actifs importés ne peuvent pas être profilés ou utilisés dans l'enrichissement de métadonnées.
  8. Passez en revue la configuration de l'importation de métadonnées. Pour apporter des modifications, cliquez sur l'icône Editer Icône d'édition sur la vignette et mettez à jour les paramètres.

  9. Cliquez sur Créer. L'actif d'importation des métadonnées est ajouté au projet et un travail d'importation de métadonnées est créé. Si vous n'avez pas configuré de planification, l'importation est exécutée immédiatement. Si vous avez configuré un planning, l'importation s'exécute selon le planning défini.

    Les actifs Important : de la même connexion qui ont déjà été importés via une importation de métadonnées différente ne sont pas importés à nouveau mais sont mis à jour. Ces actifs ne s'affichent plus dans l'importation de métadonnées initiale. Seule l'importation de métadonnées d'exécution la plus récente contient les actifs.

En fonction du résultat de l'exécution du travail d'importation de métadonnées, un message d'achèvement ou une notification d'erreur s'affiche.

Un message d'achèvement s'affiche lorsque l'exécution du travail a abouti, s'est terminée avec des avertissements ou s'est terminée avec des erreurs. Une notification d'erreur s'affiche si l'exécution complète du travail a échoué. Chaque type de notification contient un lien vers le journal d'exécution de travail qui fournit des détails sur l'exécution de travail spécifique.

Une fois l'importation terminée, vous pouvez voir la liste des actifs avec les informations suivantes:

  • Nom de l'actif, qui fournit un lien vers l'actif dans le projet ou le catalogue.
  • Le type d'actif, tel que Data, et le format, tel que Relational table.
  • Le contexte de l'actif, tel que le parent ou le chemin du fichier.
  • La date et l'heure de la dernière importation de l'actif.
  • Statut d'importation, qui peut être Imported pour les données importées, In progressou Removed, si l'actif n'a pas pu être réimporté.

Vous pouvez utiliser la plupart des actifs de données importés de la même manière qu'avec les actifs de données connectés. Les actifs importés ont une étiquette automatiquement affectée qui reflète le parent de l'actif, le cas échéant.

Pour profiler, analyser et fournir un contexte métier aux actifs de données importés, créez un actif d'enrichissement de métadonnées et incluez l'actif d'importation de métadonnées dans la portée de données.

En savoir plus

Etapes suivantes

Rubrique parent: Importation de métadonnées

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus