Les jeux de données de référence fournissent des groupements logiques de valeurs de code (valeurs de données de référence), telles que des codes produit et des codes pays. Ces codes sont généralement des ensembles de valeurs autorisées qui sont associés à des zones de données et qui peuvent être affectés à des termes métier.
Vous créez des jeux de données de référence dans IBM Knowledge Catalog afin que les normes d'entreprise soient accessibles de manière centralisée par les utilisateurs ou en consommant des applications via des API. Les jeux de données de référence peuvent également être utilisés pour fournir le modèle de correspondance pour des classes de données, ce qui permet aux zones de données d'être classifiées automatiquement via le profilage et la reconnaissance de données. Ces classes de données peuvent ensuite être utilisées dans des analyses de qualité de données pour évaluer la qualité et la cohérence des valeurs dans des colonnes de données.
Les données de référence vous aident, par exemple, à définir un ensemble de valeurs standard pour certaines zones. Il peut être utile de créer une définition standard des codes pays et d'utiliser ces données de référence pour s'assurer que les zones de code pays sont conformes. Différentes désignations telles que "US", "USA", "Etats-Unis" et "Amérique" peuvent toutes être résolues à la même valeur de référence. Par conséquent, vous pouvez obtenir des données beaucoup plus cohérentes.
Les fichiers de référence prédéfinis sont également fournis. Ils incluent les valeurs d'emplacement physique et d'emplacement souverain pour les actifs de données afin que vous puissiez contrôler l'accès aux données en fonction de l'emplacement avec des règles d'emplacement de données.
Vous pouvez créer des hiérarchies pour des jeux de données de référence. Les hiérarchies permettent de faciliter et d'accélérer les recherches de jeux de données de référence. Par exemple, si vous deviez rechercher des jeux de données sans disposer d'informations de relation, il vous faudrait vous souvenir du contexte de jeu de données et rechercher les jeux de données un par un. En revanche, avec des informations de hiérarchie, vous pouvez commencer par un jeu de données spécifique et parcourir tous les jeux qui lui sont associés dans et autour du contexte de ce jeu de données uniquement.
Vous pouvez également créer des relations entre les valeurs d'un jeu de données de référence et les valeurs d'un ou de plusieurs jeux de données de référence différents. Ces relations sont connues sous le nom de mappages de valeurs ou concordances.
Etablir des relations de cette façon peut vous aider à comprendre plus facilement la façon dont les valeurs interagissent entre les jeux de données de référence et réduire le temps passé à rechercher manuellement ces valeurs. Par exemple, dans l'image suivante, vous pouvez voir que la valeur United States of America est mappée à deux valeurs différentes dans un jeu de données de référence différent (soybean farming et agriculture) et qu'une autre valeur de pays India est mappée à une valeur de devise dans un autre jeu de données de référence.
Pour plus d'informations sur la configuration des valeurs associées, voir Importation de fichiers pour les fichiers de référence.
Affichage des jeux de données de référence
Si vous connaissez le nom du jeu de données de référence que vous recherchez, vous pouvez utiliser la barre de recherche dans la partie supérieure pour rechercher le nom. Si ce n'est pas le cas, accédez à Gouvernance > Données de référence et cliquez sur le nom de l'ensemble à afficher.
La balise Insensible à la casse en regard du nom de l'ensemble marque les ensembles pour lesquels la colonne de code est insensible à la casse et est toujours enregistrée en majuscules. Pour plus d'informations, voir Code sensible à la casse.
Le panneau Valeurs de gauche vous permet d'afficher toutes les valeurs du jeu de données de référence sélectionné. Lorsque vous affichez une liste de valeurs de données de référence, vous pouvez utiliser les méthodes suivantes pour trouver plus rapidement les valeurs requises:
- Utilisez une barre de recherche pour entrer une requête pour un code, une valeur ou une valeur de colonne personnalisée.
- Utilisez l'une des 6 options de filtre avancées.
- Utilisez la fonction de tri.
Les options de recherche, de filtrage et de tri peuvent être combinées.
Pour utiliser les options de filtre:
- Ouvrez un jeu de données de référence et cliquez sur l'icône Filtrer dans la zone de recherche.
- Définissez la première condition:
- Sélectionnez la colonne à filtrer en fonction du code, de la valeur, de la description, de la valeur parent ou de toute autre colonne définie dans le jeu de données de référence.
- Sélectionnez l'un des opérateurs de condition. Les options disponibles dépendent du type de colonne sélectionné: Est égal à, N'est pas égal à, Contient, Ne contient pas, Commence par, Ne commence pas par, Se termine par, Ne se termine pas par, Entre.
- Sélectionnez Valeur.
- Cliquez sur Et pour définir une autre condition si nécessaire.
- Cliquez sur Appliquer.
Pour trier la liste des valeurs de données de référence:
- Cliquez sur l'icône Trier dans la barre de recherche et sélectionnez la colonne en fonction de laquelle trier les valeurs.
- Sélectionnez la méthode de tri. Les méthodes de tri dépendent du type de colonne sélectionné.
- Cliquez sur Appliquer.
En savoir plus
Importation de fichiers pour des jeux de données de référence
Création de jeux de données de référence avec des clés composites
Rubrique parent : Artefacts de gouvernance (nouveau)