Configurez et exécutez l'enrichissement de métadonnées pour ajouter plusieurs couches de métadonnées à vos actifs de données.
Vous pouvez créer un profil de données pour classer un actif de données et compiler des statistiques sur les valeurs qu'il contient. Ajoutez à vos actifs des noms et des descriptions de colonnes alternatifs générés par l'IA pour les actifs de données et les colonnes qu'ils contiennent. Utilisez des contrôles de qualité de données prédéfinis pour une évaluation initiale de la qualité de vos données. Enrichissez les actifs avec un vocabulaire métier qui décrit la signification sémantique des données pour votre organisation. Identifiez les relations entre les actifs de données.
Vous pouvez également créer des enrichissements de métadonnées avec des API à la place de l'interface utilisateur. Les liens vers ces API sont répertoriés dans la section En savoir plus .
Pour créer un actif d'enrichissement de métadonnées et un travail pour l'enrichissement des données :
Ouvrez un projet et cliquez sur Nouvel actif > Enrichir les actifs de données avec des métadonnées . Une fois que vous avez créé le premier enrichissement de métadonnées de cette manière, vous pouvez ajouter de nouveaux actifs d'enrichissement de métadonnées à partir de la page Actif du projet.
Définissez les détails :
- Spécifiez un nom pour l'enrichissement de métadonnées.
- Facultatif : fournissez une description.
- Facultatif : Sélectionnez ou créez des balises à affecter à l'actif d'enrichissement des métadonnées pour simplifier la recherche. Vous pouvez créer une nouvelle étiquette en entrant son nom et en appuyant sur Entrée.
Définissez la portée de données initiale.
Sélectionnez les ressources de données que vous souhaitez enrichir à partir des actifs de données. Voir Portée des données initiales. Vérifiez la portée sélectionnée avant de continuer. Vous pouvez supprimer directement des actifs de la portée de données ou retravailler la portée entière en cliquant sur Éditer la portée des données.
Vous pouvez ignorer cette étape pour créer un actif d'enrichissement de métadonnées vide et définir la portée ultérieurement.
Définissez l'objectif de cet actif d'enrichissement de métadonnées. Vous pouvez ajouter plusieurs couches de métadonnées à un actif de données:
- Profilez les données pour les classer et compilez des statistiques sur les valeurs.
- Ajoutez d'autres noms et des descriptions générées par l'IA.
- Enrichissez les actifs avec un vocabulaire métier qui décrit la signification sémantique des données pour votre organisation.
- Exécutez des contrôles de qualité de données prédéfinis pour une évaluation initiale de la qualité.
- Identifier les clés primaires et les relations de clé.
- Évaluer la qualité des données à l'aide des règles de l'accord de niveau de service (SLA)
Sélectionnez des catégories pour déterminer le vocabulaire métier qui peut être appliqué lors de l'enrichissement. Voir Sélection de catégorie.
Sélectionnez un type d'échantillonnage. Voir Echantillonnage.
Définir le moment où le travail d'enrichissement est exécuté. Vous pouvez lancer l'enrichissement manuellement à tout moment. Voir la définition de Run.
Sélectionnez la portée de données pour les réexécutions de l'enrichissement, planifiées ou exécutées manuellement. Voir Champ d'application des rediffusions de l'enrichissement.
Vérifiez la configuration de l'enrichissement de métadonnées. Pour apporter des modifications, cliquez sur l'icône Modifier sur la tuile et mettez à jour les paramètres.
Cliquez sur Créer. La ressource d'enrichissement des métadonnées est ajoutée au projet et un travail d'enrichissement des métadonnées est créé. Pour plus d'informations, voir Gestion des emplois d'enrichissement.
Selon la définition de l'exécution, l'enrichissement peut être exécuté immédiatement après la création de la ressource d'enrichissement des métadonnées.
Une fois l'enrichissement terminé, vous pouvez accéder à une présentation générale des résultats de l'enrichissement en affichant l'actif d'enrichissement des métadonnées. À partir de là, vous pouvez explorer en aval et utiliser les résultats pour chaque actif. Voir Utilisation des résultats d'enrichissement.
L'enrichissement des métadonnées est exécuté sur les actifs disponibles dans le projet. Par conséquent, la liste des actifs enrichis peut ne pas correspondre à la portée configurée des actifs d'importation de métadonnées inclus dans les cas suivants:
- Metadata import n'était pas encore terminée lorsque l'enrichissement a démarré.
- Metadata import a échoué pour un ensemble d'actifs ou a échoué complètement.
Lorsque l'enrichissement des métadonnées est exécuté sur un grand nombre de données, il peut arriver que le traitement échoue pour un sous-ensemble de données. Pour chaque actif qui n'a pas pu être enrichi, un message d'erreur est écrit dans le journal de la tâche d'enrichissement des métadonnées afin que vous puissiez identifier ces actifs. Vous pouvez ensuite réexécuter l'enrichissement sur les immobilisations dont le traitement a échoué.
Pour plus d'informations sur la mise à jour, la réexécution ou la suppression d'un enrichissement de métadonnées, voir Gestion d'un enrichissement de métadonnées existant.
En savoir plus
Etapes suivantes
Rubrique parent : Gestion de l'enrichissement des métadonnées