0 / 0
Retourner à la version anglaise de la documentation
Conception de jeux de données de référence (IBM Knowledge Catalog)
Dernière mise à jour : 21 juin 2024
Conception de jeux de données de référence (IBM Knowledge Catalog)

Lorsque vous concevez un jeu de données de référence, vous devez décider quel format de valeurs utiliser, quelles paires de valeurs de code constituent l'ensemble et si l'ensemble doit être associé à d'autres ensembles existants. Vous pouvez importer les jeux de données de référence existants et les modifier en fonction de vos besoins, ou créer manuellement un nouveau jeu de données de référence.

Les données de référence sont utilisées pour catégoriser d'autres données dans les applications et les bases de données d'entreprise. Les données de référence peuvent être normalisées par des organisations telles que l'ISO. Les données de référence peuvent être hiérarchiques. Il peut exister plusieurs jeux de données de référence pour le même domaine, auquel cas des mappages entre les valeurs de données de référence peuvent être spécifiés.

Un ensemble de données de référence se compose d'un certain nombre de valeurs de données de référence, où chaque valeur de données de référence doit au moins avoir un code et sa valeur définie.

Vous pouvez créer un nouvel ensemble de données de référence à l'aide de l'interface utilisateur ou importer ses propriétés à partir d'un fichier CSV. Il en va de même pour les valeurs de données de référence: elles peuvent être ajoutées manuellement ou importées à partir du fichier CSV. Notez que les fichiers CSV pour les jeux de données de référence et pour les valeurs de données de référence diffèrent.

Vous pouvez utiliser l'une des méthodes suivantes pour importer des jeux de données de référence:

  • Importez un ou plusieurs jeux de données de référence à partir d'un fichier ZIP précédemment exporté à l'aide d'une demande d'API. Le fichier ZIP contient un fichier CSV avec les propriétés définissant un ou plusieurs jeux de données de référence, et un fichier CSV pour chaque jeu de données de référence répertoriant les valeurs de données de référence.
  • Importez des informations de jeu de données de référence à partir d'un fichier CSV à l'aide de l'interface utilisateur ou d'une demande d'API. Plusieurs jeux de données de référence peuvent être importés dans un même fichier. Cette méthode n'inclut pas les valeurs de données de référence-elles doivent être importées séparément.
  • Importez des valeurs de données de référence à partir d'un fichier CSV pour un ensemble spécifique à l'aide de l'interface utilisateur ou d'une demande d'API.

Pour en savoir plus sur ces méthodes d'importation et sur les différences entre elles, voir Importation de méthodes pour les artefacts de gouvernance.

Vous pouvez également utiliser l'un des jeux de données de référence prédéfinis. De plus, chaque Knowledge Accelerator fournit des centaines de jeux de données de référence pour un secteur spécifique que vous pouvez utiliser. Voir Jeux de données de référence dans Knowledge Accelerators.

Les plansIBM Knowledge Catalog ont des limites sur le nombre et la taille des fichiers de référence que vous pouvez créer.

Propriétés des jeux de données de référence

Les ensembles de données de référence possèdent ces propriétés standard qui sont similaires à d'autres artefacts de gouvernance.

Propriété ou comportement Prend en charge ? Explication
Doit avoir des noms uniques ? Oui Les noms de fichier de référence doivent être uniques au sein d'une catégorie.
Description? Oui Facultatif. Incluez une description pour aider les utilisateurs à trouver ce jeu de données de référence.
Ajouter des relations à d'autres jeux de données de référence? Oui Voir Relations avec d'autres jeux de données de référence.
Ajouter des relations à d'autres types d'artefacts de gouvernance ? Oui Voir Relations avec d'autres types d'artefacts de gouvernance.
Ajouter une relation à l'actif? Oui Voir Relations d'actifs dans les catalogues.
Ajouter des attributs personnalisés ? Oui Voir Attributs et relations personnalisés
Ajouter des relations personnalisées ? Oui Voir Attributs et relations personnalisés
Organiser en catégories ? Oui La catégorie principale de l'artefact détermine qui peut afficher ou modifier l'artefact. Voir Catégories.
Importer à partir d'un fichier ? Oui Voir Importation d'artefacts de gouvernance.
Importer à partir d'un Knowledge Accelerator ? Oui
Exporter dans un fichier ? Oui Voir Exportation des artefacts de gouvernance.
Géré par flux de travaux ? Oui Voir Flux de travaux.
Indiquez les dates de début et de fin effectives ? Oui Voir Dates d'effet.
Affecter un intendant ? Oui Voir Intendant.
Ajouter des balises en tant que propriétés ? Oui Voir Balises.
Artefacts prédéfinis ? Oui Emplacements physiques, emplacements souverains. Voir Ensembles de données de référence prédéfinis

Lors de la création d'un nouveau jeu de données de référence, vous devez choisir le type à utiliser. Le type que vous choisissez détermine le format de la colonne de valeurs pour les valeurs de données de référence:

Texte
Il peut s'agir d'une chaîne ou d'une chaîne multiligne.
Nombre
Ne prend pas en charge les valeurs booléennes, binaires ou hexadécimales.
Date
Format de date et d'heure ISO.

Propriétés des valeurs de données de référence

Un jeu de données de référence inclut un certain nombre de valeurs de données de référence. Ces valeurs sont constituées au moins des colonnes suivantes:

code
Chaîne pouvant comporter jusqu'à 255 caractères. La colonne de code est toujours de type Texte.
Valeur
Le format de la valeur est déterminé par le type de fichier de référence: Texte, Nombre, Date.
description
Les valeurs sont facultatives.
Parent
Les valeurs sont facultatives. La relation parent pointe vers une autre valeur de données de référence dans le même ensemble. En spécifiant le parent, vous pouvez créer une arborescence hiérarchique de valeurs de données de référence.

Code sensible à la casse

Le code sensible à la casse a été introduit le 16 février 2024. Pour tous les jeux de données de référence créés après cette date, la colonne de code est sensible à la casse. Lorsque vous ajoutez des valeurs à un nouveau jeu de données de référence, le code est sauvegardé exactement comme vous l'avez saisi. Les codes suivants sont traités comme trois entrées uniques:

  • États-Unis
  • US
  • fr

Auparavant, tous les codes étaient automatiquement remplacés par des majuscules lors de la sauvegarde, par exemple:

  • us a été sauvegardé en tant que US
  • 1pl a été sauvegardé en tant que 1PL

Notez que tous les jeux de données de référence qui ont été créés avant l'introduction de cette modification restent insensibles à la casse et que les nouvelles valeurs qui y ont été ajoutées seront sauvegardées en majuscules. Ces jeux de données de référence sont marqués avec une balise insensible à la casse dans l'interface utilisateur.

Colonnes personnalisées

Vous devrez peut-être capturer des informations supplémentaires liées au code, telles que des traductions de la valeur dans différentes langues ou d'autres informations d'attribut de support adaptées à vos besoins. Par exemple, il se peut que vous disposiez d'un jeu de données de référence de codes pays et que vous souhaitiez capturer d'autres attributs tels que le premier ministre du pays, la langue ou des variantes du nom. Pour ce faire, vous pouvez ajouter des colonnes personnalisées de l'une des manières suivantes à l'aide de l'interface utilisateur:

  • Vous pouvez définir manuellement des colonnes personnalisées lors de la création d'un jeu de données de référence. Notez que les colonnes personnalisées ne peuvent pas être modifiées ou ajoutées manuellement une fois que le jeu de données de référence a été créé.
  • Vous pouvez utiliser l'importation de fichier CSV pour créer un nouvel ensemble de données de référence et mapper les colonnes du fichier vers de nouvelles colonnes personnalisées.
  • Vous pouvez importer ou réimporter des valeurs à partir d'un fichier CSV dans un jeu de données de référence existant et utiliser le mappage de colonnes pour créer de nouvelles colonnes personnalisées.

Pour plus d'informations, voir Importation de colonnes personnalisées.

Clés composites

Les valeurs de données de référence d'un ensemble sont identifiées par un code unique. Toutefois, vous devrez peut-être identifier les données à l'aide de plusieurs colonnes. Une clé composite est une combinaison de la colonne de code et jusqu'à 5 colonnes personnalisées dans un jeu de données de référence. La clé composite est utilisée pour identifier de manière unique chaque valeur de données de référence. Avec une clé composite, les valeurs de la colonne de code n'ont plus besoin d'être uniques. L'unicité n'est garantie que lorsque les valeurs de toutes les colonnes spécifiées sont combinées-les valeurs des colonnes individuelles ne sont pas nécessairement uniques.

Lorsque vous définissez une clé composite pour l'ensemble, chaque valeur de données de référence d'un tel ensemble est identifiée dans le système par une représentation physique de la clé composite, qui est une concaténation de la colonne de code et des colonnes personnalisées de clé composite dans l'ordre spécifié lors de la création initiale de l'ensemble. Les valeurs sont délimitées par |, par exemple: CODE|CC1|CC2|CC3. Cette représentation physique est utilisée pour identifier les valeurs de données de référence dans le système (par exemple, pour suivre les relations) et ne peut pas être modifiée.

Pour savoir comment créer des jeux de données de référence avec des clés composites, voir Création de jeux de données de référence avec des clés composites.

Relations avec d'autres types d'artefacts de gouvernance

Relations entre les classes de données et les jeux de données de référence: les classes de données peuvent inclure des jeux de données de référence dans des méthodes de mise en correspondance des données. L'ensemble de données de référence est ensuite utilisé pour évaluer si les colonnes des actifs de données répondent aux critères d'attribution de la classe de données. Voir Ajout de données correspondant à des classes de données.

Relations avec les termes métier: vous pouvez affecter des termes métier à l'ensemble de données de référence ou à une valeur de données de référence spécifique pour définir plus précisément la signification du code.

Relations avec d'autres jeux de données de référence

Vous pouvez créer des relations hiérarchiques pour vos jeux de données de référence qui établissent des connexions logiques entre eux. Vous pouvez également créer des relations entre les valeurs des jeux de données de référence. Voir Relations entre les jeux de données de référence.

Utilisation des jeux de données de référence

Vous pouvez utiliser un jeu de données de référence de l'une des manières suivantes:

  • Cliquez sur (Icône de téléchargement) pour télécharger les valeurs de données de référence dans un fichier CSV. Vous pouvez ensuite éditer le fichier CSV en local, ce qui offre souvent plus de rapidité et de flexibilité dans votre travail.
  • Importez des valeurs à partir d'un fichier CSV en sélectionnant Télécharger le fichier dans le menu d'action en regard du nom des données de référence et en suivant les instructions.
  • Créez vos propres valeurs en cliquant sur (Ajouter une icône).
  • Editez une valeur de données de référence (sa valeur, sa description ou sa valeur parent) en cliquant sur (Icône Editer).
  • Réorganisez l'affichage des colonnes dans la vue des valeurs de données de référence en cliquant sur Gérer les colonnes.
  • Supprimez les valeurs de données de référence en cliquant sur Supprimer la valeur. Marquez plusieurs valeurs pour suppression à l'aide de la touche Ctrl.
  • Affectez des artefacts associés à l'ensemble de données de référence, tels que des termes métier ou des classifications.
  • Ajoutez des termes métier associés à une valeur choisie.
  • Ajoutez des valeurs associées à une valeur choisie. Vous pouvez associer des valeurs à partir du même ensemble ou entre des ensembles différents. Vous pouvez les importer à partir d'un fichier CSV en sélectionnant Télécharger les valeurs associées dans le menu d'action en regard du nom des données de référence et en suivant les instructions.

Pour en savoir plus sur les tâches communes à tous les artefacts de gouvernance, voir Gestion des artefacts de gouvernance

En savoir plus

Rubrique parent : Données de référence

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus