Vous indiquez comment gérer des actifs en double lorsque vous créez un catalogue et que vous publiez des actifs dans un catalogue.
Qu'est-ce qu'un doublon ?
Un actif est considéré comme un doublon d'un autre actif dans ces situations :
- L'actif a été copié à partir d'un actif existant dans la plateforme.
- Le nouvel actif entrant dans la plateforme possède le même type d'actif et le même nom qu'un actif existant.
Détection des actifs copiés en doublon
Vous créez des copies d'actifs dans la plateforme à l'aide de ces actions :
- Copie d'un actif d'un catalogue vers un projet ou un espace de déploiement.
- Publication d'un actif dans un catalogue à partir d'un projet ou d'un espace de déploiement.
Par exemple, vous copiez un actif d'un catalogue dans un projet. Ensuite, vous publiez cet actif du projet vers le même catalogue. L'actif entrant du projet est considéré comme un doublon de l'actif d'origine dans le catalogue. Vous pouvez également publier un actif d'un projet dans un catalogue. Ensuite, vous copiez cet actif du catalogue dans le même projet. L'actif entrant du catalogue est considéré comme un doublon de l'actif d'origine du projet.
Vous devez choisir la façon de gérer le doublon.
Si vous copiez ou publiez le même actif plusieurs fois, la copie la plus récente de l'actif est considérée comme l'actif d'origine. Par exemple, vous copiez un actif d'un catalogue dans un projet. Ensuite, vous copiez le même actif du catalogue dans le même projet. La nouvelle copie de l'actif est considérée comme l'actif d'origine.
Duplicate Detection des nouveaux actifs
Si vous ajoutez un actif à un projet, un catalogue ou un espace de déploiement ayant le même type d'actif et le même nom, ce nouvel actif est considéré comme un doublon de l'actif d'origine.
Par exemple, vous disposez d'un bloc-notes nommé " Ventes " et vous ajoutez un actif de données nommé " Ventes ". Ces actifs ne sont pas des doublons car leurs types d'actif sont différents.
Pour les actifs de données dans les catalogues, l'origine des données est prise en compte avec le nom de l'actif. Par exemple, les actifs de données suivants ne sont pas considérés comme des doublons:
- Un actif de données nommé " Ventes " à partir d'un fichier CSV
- Un actif de données nommé " Ventes " à partir d'une connexion Db2 nommée "db2_100"
- Un actif de données nommé " Ventes " à partir d'une connexion Db2 nommée "db2_5000"
Méthodes de gestion des actifs en double
Vous pouvez spécifier l'une de ces méthodes de traitement en double comme valeur par défaut pour un catalogue :
- Mettre à jour les actifs d'origine (valeur par défaut)
Remplacez les valeurs des actifs d'origine par les valeurs des nouveaux actifs. Si les nouveaux actifs n'ont pas de valeur, les valeurs correspondantes des actifs d'origine restent. Le niveau de vie privée, la propriété, l'appartenance et les activités des actifs d'origine sont conservés. Les notes d'actif entrantes sont ajoutées aux notes d'origine. - Écraser les actifs d'origine
Écraser toutes les valeurs des actifs d'origine avec les valeurs des nouveaux actifs. Cependant, le niveau de vie privée, la propriété, l'appartenance et les activités des actifs d'origine ne sont pas affectés. - Autoriser les doublons
Ajoutez les nouveaux actifs en tant que doublons des actifs d'origine. - Conserver les actifs d'origine et rejeter les doublons
Rejeter les nouveaux actifs en double et conserver les actifs d'origine.
Vous définissez la méthode de gestion des doublons par défaut pour un catalogue lorsque vous le créez. Vous pouvez le modifier à tout moment sur la page des paramètres du catalogue, si vous disposez du rôle d'administrateur dans le catalogue.
Lorsque les utilisateurs ajoutent des actifs à un catalogue avec des appels d'API, la méthode de gestion des actifs en double par défaut pour le catalogue est utilisée. Toutefois, le paramètre de gestion des doublons de catalogue peut être remplacé dans ces circonstances :
Publication à partir d'un projet ou ajout à un catalogue directement
Les collaborateurs du projet peuvent choisir comment traiter les actifs en double lorsqu'ils publient des actifs du projet dans un catalogue. Si le paramètre de catalogue par défaut autorise les doublons, les collaborateurs du projet peuvent choisir de combiner ou d'écraser les actifs existants, de créer des doublons ou de rejeter des actifs en double. Pour ajouter des actifs, uniques ou en double, l'utilisateur doit avoir le rôle d'administrateur ou Éditeur dans le catalogue. Pour mettre à jour ou remplacer un actif, l'utilisateur doit avoir le rôle Admin dans le catalogue ou le rôle Editeur et être le propriétaire de l'actif ou un éditeur d'actif editor.When publie des résultats d'enrichissement de métadonnées, les affectations de classe de données et de terme métier sont publiées comme suit:-Si un actif en double est créé, l'ensemble complet est publié avec l'actif. -Si un actif existant est mis à jour ou remplacé, tous les termes métier qui ne sont pas encore disponibles sur l'actif sont ajoutés. Aucun terme métier n'est supprimé. Si la classe de données d'une colonne a été modifiée, l'affectation sur l'actif de catalogue est mise à jour.Importation des métadonnées
Indépendamment du paramètre de catalogue, des actifs en double peuvent être ajoutés au catalogue lors d'une importation initiale de métadonnées. Lors des ré-exécutions d'une importation de métadonnées, les actifs précédemment importés restent inchangés ou sont mis à jour, en fonction des modifications apportées à la source de données. Les métadonnées supplémentaires, comme les termes ou les classifications, demeurent inchangées.
En savoir plus
Rubrique parent : Création d'un catalogue