0 / 0
Retourner à la version anglaise de la documentation
Classes de données Knowledge Accelerators
Dernière mise à jour : 21 juin 2024
Quelles sont les classes de données Knowledge Accelerators

Les Knowledge Accelerators étendent l'ensemble de classes de données fourni dans IBM Knowledge Catalog avec des classes de données décrivant les types de données couramment trouvés dans les actifs de plusieurs secteurs d'activité, en plus des classes de données basées sur les normes de l'industrie telles que ISO, FHIR et CIM. Ces nouvelles classes de données décrivent les informations couramment utilisées dans les sources de données Énergie et utilitaires, Services financiers, Santé, Assuranceet d'autres sources de données intersectorielles .

Les classes de données décrivent le type et les caractéristiques des données contenues dans les actifs de données. Ils sont utilisés lors de l'enrichissement des métadonnées IBM Knowledge Catalog en données de profil. Les Knowledge Accelerators incluent des classes de données spécifiques au secteur qui utilisent les codes des jeux de données de référence ou des listes de valeurs valides, ajoutent des expressions régulières pour identifier des modèles de données ou des critères de correspondance de noms de colonne.

Les classes de données Knowledge Accelerators améliorent la capacité du processus d'enrichissement IBM Knowledge Catalog à reconnaître les données spécifiques au secteur d'activité. Les classes de données IBM Knowledge Catalog existantes et les nouvelles classes de données fournies par Knowledge Accelerators sont toutes combinées dans une nouvelle hiérarchie de catégories basée sur des sujets tels que la démographie, la finance et l'emplacement. Cette sous-catégorisation permet de les inclure de manière sélective dans différents enrichissements de métadonnées afin d'améliorer la précision de la correspondance. Comme les classes de données sont prémappées aux termes du vocabulaire Business Core, l'enrichissement des métadonnées affecte également automatiquement le terme métier lorsqu'il fait correspondre les données d'un actif à une classe de données.

Les classes de données qui sont pertinentes pour les données à caractère personnel ont également une classification des informations à caractère personnel (PI) ou des informations à caractère personnel sensibles (SPI) en fonction de la sensibilité des données qu'elles décrivent. Cette classification facilite l'identification des données personnelles dans les actifs de données et prend en charge l'application de règles de protection des données pour contrôler l'accès aux données.

Les classes de données sont entièrement personnalisables et, si nécessaire, peuvent être ajustées pour se concentrer sur les fichiers de référence spécifiques au client ou sur les restrictions de correspondance de noms de colonne.
Remarque :

L'ensemble de classes de données fourni avec IBM Knowledge Catalog se trouve dans la catégorie de niveau supérieur "Non catégorisé". L'importation de l'un des Knowledge Accelerators crée une copie de ces classes de données, avec des classifications PI/SPI ajoutées, et les place dans des sous-catégories de la nouvelle hiérarchie de catégories'Data Classes', en plus des nouvelles classes de données Knowledge Accelerators .

Les classes de données en double peuvent être supprimées de'Non catégorisé'à la suite d'une vérification des relations existantes avec des termes métier ou des affectations à des actifs de données, qui peuvent avoir besoin d'être transférées aux nouvelles copies importées avec Knowledge Accelerators.

Tableau 1. Exemples de classes de données
Secteur d'activité Classe de données Descriptif Catégorie principale Méthode de correspondance Jeu de données de référence Valeurs de données de référence Termes métier
Intersectoriel Numéro de téléphone international La collecte d'informations qui identifie un numéro de téléphone spécifique tel que défini par les services de télécommunications ... Classes de données communes Correspondance avec les critères de l'expression régulière Expression régulière Exemples :
  • +14655551212
  • +4402079460111
  • 003530209138764
Numéro de téléphone
Énergie et services publics Type de bâtiment Type de la structure du bâtiment qui a été construite. Classes de données communes Correspondance avec la liste des valeurs valides Valeurs valides
  • Détachée
  • bungalow
  • Chalet
  • Ferme
  • Dôme
  • ...
Type de bâtiment
Marchés financiers Code de devise Code standard pour représenter une devise, à l'aide d'un code numérique ou alphabétique. Cette classe de données contient le contenu des codes de devise ISO 4217. Classes de données financières Correspondance avec la liste des valeurs valides Valeurs valides
  • Dollars US
  • EUR
  • pool de mémoire tampon de groupe
  • SEK
  • Yen
  • ...
Code de devise
Soins de santé Type de groupe sanguin Classe les types de sang en fonction du statut ABO/Rh. Classes de données de santé et de biométrie Correspondance avec la liste des valeurs valides Valeurs valides
  • A +
  • A-
  • B +
  • B-
  • O +
  • O-
  • ...
Groupe sanguin
Assurance Type de véhicule Type ou catégorisation associé au modèle de véhicule. KAIN-Informations sur les véhicules et classes de données sur les accidents Correspondance avec les données de référence Type de véhicule
  • Voiture
  • Cycle de pédale
  • Véhicule agricole
  • Moto de plus de 500cc
  • Marchandises 7.5 tonnes mgw et plus
  • ..
Type de véhicule
Remarque: De nombreuses classes de données répertoriées dans les exemples ci-dessus sont pertinentes pour plusieurs secteurs d'activité et sont donc partagées entre les Knowledge Accelerators , le cas échéant.

En savoir plus

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus