Lorsque vous concevez un jeu de données de référence, vous devez décider quel format de valeurs utiliser, quelles paires de valeurs de code constituent l'ensemble et si l'ensemble doit être associé à d'autres ensembles existants. Vous pouvez importer les jeux de données de référence existants et les modifier en fonction de vos besoins, ou créer manuellement un nouveau jeu de données de référence.
Les données de référence sont utilisées pour catégoriser d'autres données dans les applications et les bases de données d'entreprise. Les données de référence peuvent être normalisées par des organisations telles que l'ISO. Les données de référence peuvent être hiérarchiques. Il peut exister plusieurs jeux de données de référence pour le même domaine, auquel cas des mappages entre les valeurs de données de référence peuvent être spécifiés.
Un ensemble de données de référence se compose d'un certain nombre de valeurs de données de référence, où chaque valeur de données de référence doit au moins avoir un code et sa valeur définie.
Vous pouvez créer un nouvel ensemble de données de référence à l'aide de l'interface utilisateur ou importer ses propriétés à partir d'un fichier CSV. Il en va de même pour les valeurs de données de référence: elles peuvent être ajoutées manuellement ou importées à partir du fichier CSV. Notez que les fichiers CSV pour les jeux de données de référence et pour les valeurs de données de référence diffèrent.
Vous pouvez utiliser l'une des méthodes suivantes pour importer des jeux de données de référence:
- Importez un ou plusieurs jeux de données de référence à partir d'un fichier ZIP précédemment exporté à l'aide d'une demande d'API. Le fichier ZIP contient un fichier CSV avec les propriétés définissant un ou plusieurs jeux de données de référence, et un fichier CSV pour chaque jeu de données de référence répertoriant les valeurs de données de référence.
- Importez des informations de jeu de données de référence à partir d'un fichier CSV à l'aide de l'interface utilisateur ou d'une demande d'API. Plusieurs jeux de données de référence peuvent être importés dans un même fichier. Cette méthode n'inclut pas les valeurs de données de référence-elles doivent être importées séparément.
- Importez des valeurs de données de référence à partir d'un fichier CSV pour un ensemble spécifique à l'aide de l'interface utilisateur ou d'une demande d'API.
Pour en savoir plus sur ces méthodes d'importation et sur les différences entre elles, voir Importation de méthodes pour les artefacts de gouvernance.
Vous pouvez également utiliser l'un des jeux de données de référence prédéfinis. De plus, chaque Knowledge Accelerator fournit des centaines de jeux de données de référence pour un secteur spécifique que vous pouvez utiliser. Voir Jeux de données de référence dans Knowledge Accelerators.
Les plansIBM Knowledge Catalog ont des limites sur le nombre et la taille des fichiers de référence que vous pouvez créer.
- Propriétés des jeux de données de référence
- Propriétés des valeurs de données de référence
- Relations avec d'autres types d'artefacts de gouvernance
- Relations avec d'autres jeux de données de référence
- Utilisation des jeux de données de référence
Propriétés des jeux de données de référence
Les ensembles de données de référence possèdent ces propriétés standard qui sont similaires à d'autres artefacts de gouvernance.
Propriété ou comportement | Prend en charge ? | Explication |
---|---|---|
Doit avoir des noms uniques ? | Oui | Les noms de fichier de référence doivent être uniques au sein d'une catégorie. |
Description? | Oui | Facultatif. Incluez une description pour aider les utilisateurs à trouver ce jeu de données de référence. |
Ajouter des relations à d'autres jeux de données de référence? | Oui | Voir Relations avec d'autres jeux de données de référence. |
Ajouter des relations à d'autres types d'artefacts de gouvernance ? | Oui | Voir Relations avec d'autres types d'artefacts de gouvernance. |
Ajouter une relation à l'actif? | Oui | Voir Relations d'actifs dans les catalogues. |
Ajouter des attributs personnalisés ? | Oui | Voir Attributs et relations personnalisés |
Ajouter des relations personnalisées ? | Oui | Voir Attributs et relations personnalisés |
Organiser en catégories ? | Oui | La catégorie principale de l'artefact détermine qui peut afficher ou modifier l'artefact. Voir Catégories. |
Importer à partir d'un fichier ? | Oui | Voir Importation d'artefacts de gouvernance. |
Importer à partir d'un Knowledge Accelerator ? | Oui | |
Exporter dans un fichier ? | Oui | Voir Exportation des artefacts de gouvernance. |
Géré par flux de travaux ? | Oui | Voir Flux de travaux. |
Indiquez les dates de début et de fin effectives ? | Oui | Voir Dates d'effet. |
Affecter un intendant ? | Oui | Voir Intendant. |
Ajouter des balises en tant que propriétés ? | Oui | Voir Balises. |
Artefacts prédéfinis ? | Oui | Emplacements physiques, emplacements souverains. Voir Ensembles de données de référence prédéfinis |
Lors de la création d'un nouveau jeu de données de référence, vous devez choisir le type à utiliser. Le type que vous choisissez détermine le format de la colonne de valeurs pour les valeurs de données de référence:
- Texte
- Il peut s'agir d'une chaîne ou d'une chaîne multiligne.
- Nombre
- Ne prend pas en charge les valeurs booléennes, binaires ou hexadécimales.
- Date
- Format de date et d'heure ISO.
Propriétés des valeurs de données de référence
Un jeu de données de référence inclut un certain nombre de valeurs de données de référence. Ces valeurs sont constituées au moins des colonnes suivantes:
- code
- Chaîne pouvant comporter jusqu'à 255 caractères. La colonne de code est toujours de type Texte.
- Valeur
- Le format de la valeur est déterminé par le type de fichier de référence: Texte, Nombre, Date.
- description
- Les valeurs sont facultatives.
- Parent
- Les valeurs sont facultatives. La relation parent pointe vers une autre valeur de données de référence dans le même ensemble. En spécifiant le parent, vous pouvez créer une arborescence hiérarchique de valeurs de données de référence.
Code sensible à la casse
Le code sensible à la casse a été introduit le 16 février 2024. Pour tous les jeux de données de référence créés après cette date, la colonne de code est sensible à la casse. Lorsque vous ajoutez des valeurs à un nouveau jeu de données de référence, le code est sauvegardé exactement comme vous l'avez saisi. Les codes suivants sont traités comme trois entrées uniques:
- États-Unis
- US
- fr
Auparavant, tous les codes étaient automatiquement remplacés par des majuscules lors de la sauvegarde, par exemple:
- us a été sauvegardé en tant que US
- 1pl a été sauvegardé en tant que 1PL
Notez que tous les jeux de données de référence qui ont été créés avant l'introduction de cette modification restent insensibles à la casse et que les nouvelles valeurs qui y ont été ajoutées seront sauvegardées en majuscules. Ces jeux de données de référence sont marqués avec une balise insensible à la casse dans l'interface utilisateur.
Colonnes personnalisées
Vous devrez peut-être capturer des informations supplémentaires liées au code, telles que des traductions de la valeur dans différentes langues ou d'autres informations d'attribut de support adaptées à vos besoins. Par exemple, il se peut que vous disposiez d'un jeu de données de référence de codes pays et que vous souhaitiez capturer d'autres attributs tels que le premier ministre du pays, la langue ou des variantes du nom. Pour ce faire, vous pouvez ajouter des colonnes personnalisées de l'une des manières suivantes à l'aide de l'interface utilisateur:
- Vous pouvez définir manuellement des colonnes personnalisées lors de la création d'un jeu de données de référence. Notez que les colonnes personnalisées ne peuvent pas être modifiées ou ajoutées manuellement une fois que le jeu de données de référence a été créé.
- Vous pouvez utiliser l'importation de fichier CSV pour créer un nouvel ensemble de données de référence et mapper les colonnes du fichier vers de nouvelles colonnes personnalisées.
- Vous pouvez importer ou réimporter des valeurs à partir d'un fichier CSV dans un jeu de données de référence existant et utiliser le mappage de colonnes pour créer de nouvelles colonnes personnalisées.
Pour plus d'informations, voir Importation de colonnes personnalisées.
Clés composites
Les valeurs de données de référence d'un ensemble sont identifiées par un code unique. Toutefois, vous devrez peut-être identifier les données à l'aide de plusieurs colonnes. Une clé composite est une combinaison de la colonne de code et jusqu'à 5 colonnes personnalisées dans un jeu de données de référence. La clé composite est utilisée pour identifier de manière unique chaque valeur de données de référence. Avec une clé composite, les valeurs de la colonne de code n'ont plus besoin d'être uniques. L'unicité n'est garantie que lorsque les valeurs de toutes les colonnes spécifiées sont combinées-les valeurs des colonnes individuelles ne sont pas nécessairement uniques.
Lorsque vous définissez une clé composite pour l'ensemble, chaque valeur de données de référence d'un tel ensemble est identifiée dans le système par une représentation physique de la clé composite, qui est une concaténation de la colonne de code et des colonnes personnalisées de clé composite dans l'ordre spécifié lors de la création initiale de l'ensemble. Les valeurs sont délimitées par |, par exemple: CODE|CC1|CC2|CC3
. Cette représentation physique est utilisée pour identifier les valeurs de données de référence dans le système (par exemple, pour suivre les relations) et ne peut pas être modifiée.
Pour savoir comment créer des jeux de données de référence avec des clés composites, voir Création de jeux de données de référence avec des clés composites.
Relations avec d'autres types d'artefacts de gouvernance
Relations entre les classes de données et les jeux de données de référence: les classes de données peuvent inclure des jeux de données de référence dans des méthodes de mise en correspondance des données. L'ensemble de données de référence est ensuite utilisé pour évaluer si les colonnes des actifs de données répondent aux critères d'attribution de la classe de données. Voir Ajout de données correspondant à des classes de données.
Relations avec les termes métier: vous pouvez affecter des termes métier à l'ensemble de données de référence ou à une valeur de données de référence spécifique pour définir plus précisément la signification du code.
Relations avec d'autres jeux de données de référence
Vous pouvez créer des relations hiérarchiques pour vos jeux de données de référence qui établissent des connexions logiques entre eux. Vous pouvez également créer des relations entre les valeurs des jeux de données de référence. Voir Relations entre les jeux de données de référence.
Utilisation des jeux de données de référence
Vous pouvez utiliser un jeu de données de référence de l'une des manières suivantes:
- Cliquez sur () pour télécharger les valeurs de données de référence dans un fichier CSV. Vous pouvez ensuite éditer le fichier CSV en local, ce qui offre souvent plus de rapidité et de flexibilité dans votre travail.
- Importez des valeurs à partir d'un fichier CSV en sélectionnant Télécharger le fichier dans le menu d'action en regard du nom des données de référence et en suivant les instructions.
- Créez vos propres valeurs en cliquant sur ().
- Editez une valeur de données de référence (sa valeur, sa description ou sa valeur parent) en cliquant sur ().
- Réorganisez l'affichage des colonnes dans la vue des valeurs de données de référence en cliquant sur Gérer les colonnes.
- Supprimez les valeurs de données de référence en cliquant sur Supprimer la valeur. Marquez plusieurs valeurs pour suppression à l'aide de la touche Ctrl.
- Affectez des artefacts associés à l'ensemble de données de référence, tels que des termes métier ou des classifications.
- Ajoutez des termes métier associés à une valeur choisie.
- Ajoutez des valeurs associées à une valeur choisie. Vous pouvez associer des valeurs à partir du même ensemble ou entre des ensembles différents. Vous pouvez les importer à partir d'un fichier CSV en sélectionnant Télécharger les valeurs associées dans le menu d'action en regard du nom des données de référence et en suivant les instructions.
Pour en savoir plus sur les tâches communes à tous les artefacts de gouvernance, voir Gestion des artefacts de gouvernance
En savoir plus
- Importation de fichiers pour des jeux de données de référence
- Relations entre les jeux de données de référence
- Fichiers de référence prédéfinis
Rubrique parent : Données de référence