Les Knowledge Accelerators étendent l'ensemble de classes de données fourni dans IBM Knowledge Catalog avec des classes de données décrivant les types de données couramment trouvés dans les actifs de plusieurs secteurs d'activité, en plus des classes de données basées sur les normes de l'industrie telles que ISO, FHIR et CIM. Ces nouvelles classes de données décrivent les informations couramment utilisées dans les sources de données Énergie et utilitaires, Services financiers, Santé, Assuranceet d'autres sources de données intersectorielles .
Les classes de données décrivent le type et les caractéristiques des données contenues dans les actifs de données. Ils sont utilisés lors de l'enrichissement des métadonnées IBM Knowledge Catalog en données de profil. Les Knowledge Accelerators incluent des classes de données spécifiques au secteur qui utilisent les codes des jeux de données de référence ou des listes de valeurs valides, ajoutent des expressions régulières pour identifier des modèles de données ou des critères de correspondance de noms de colonne.
Les classes de données Knowledge Accelerators améliorent la capacité du processus d'enrichissement IBM Knowledge Catalog à reconnaître les données spécifiques au secteur d'activité. Les classes de données IBM Knowledge Catalog existantes et les nouvelles classes de données fournies par Knowledge Accelerators sont toutes combinées dans une nouvelle hiérarchie de catégories basée sur des sujets tels que la démographie, la finance et l'emplacement. Cette sous-catégorisation permet de les inclure de manière sélective dans différents enrichissements de métadonnées afin d'améliorer la précision de la correspondance. Comme les classes de données sont prémappées aux termes du vocabulaire Business Core, l'enrichissement des métadonnées affecte également automatiquement le terme métier lorsqu'il fait correspondre les données d'un actif à une classe de données.
Les classes de données qui sont pertinentes pour les données à caractère personnel ont également une classification des informations à caractère personnel (PI) ou des informations à caractère personnel sensibles (SPI) en fonction de la sensibilité des données qu'elles décrivent. Cette classification facilite l'identification des données personnelles dans les actifs de données et prend en charge l'application de règles de protection des données pour contrôler l'accès aux données.
L'ensemble de classes de données fourni avec IBM Knowledge Catalog se trouve dans la catégorie de niveau supérieur "Non catégorisé". L'importation de l'un des Knowledge Accelerators crée une copie de ces classes de données, avec des classifications PI/SPI ajoutées, et les place dans des sous-catégories de la nouvelle hiérarchie de catégories'Data Classes', en plus des nouvelles classes de données Knowledge Accelerators .
Les classes de données en double peuvent être supprimées de'Non catégorisé'à la suite d'une vérification des relations existantes avec des termes métier ou des affectations à des actifs de données, qui peuvent avoir besoin d'être transférées aux nouvelles copies importées avec Knowledge Accelerators.
Secteur d'activité | Classe de données | Descriptif | Catégorie principale | Méthode de correspondance | Jeu de données de référence | Valeurs de données de référence | Termes métier |
---|---|---|---|---|---|---|---|
Intersectoriel | Numéro de téléphone international | La collecte d'informations qui identifie un numéro de téléphone spécifique tel que défini par les services de télécommunications ... | Classes de données communes | Correspondance avec les critères de l'expression régulière | Expression régulière | Exemples :
|
Numéro de téléphone |
Énergie et services publics | Type de bâtiment | Type de la structure du bâtiment qui a été construite. | Classes de données communes | Correspondance avec la liste des valeurs valides | Valeurs valides |
|
Type de bâtiment |
Marchés financiers | Code de devise | Code standard pour représenter une devise, à l'aide d'un code numérique ou alphabétique. Cette classe de données contient le contenu des codes de devise ISO 4217. | Classes de données financières | Correspondance avec la liste des valeurs valides | Valeurs valides |
|
Code de devise |
Soins de santé | Type de groupe sanguin | Classe les types de sang en fonction du statut ABO/Rh. | Classes de données de santé et de biométrie | Correspondance avec la liste des valeurs valides | Valeurs valides |
|
Groupe sanguin |
Assurance | Type de véhicule | Type ou catégorisation associé au modèle de véhicule. | KAIN-Informations sur les véhicules et classes de données sur les accidents | Correspondance avec les données de référence | Type de véhicule |
|
Type de véhicule |
En savoir plus
- Voir classes de données dans IBM Knowledge Catalog.