Le classi di dati descrivono il tipo di dati contenuti negli asset di dati, come i campi di dati o le colonne della tabella, ad esempio, la città, il numero di telefono o il numero della carta di credito. IBM Knowledge Catalog offre una serie di classi di dati predefinite.
Le classi di dati sono algoritmi che consentono alle organizzazioni di assegnare termini di business a elementi di dati, in base alla sintassi dei dati. Le classi di dati vengono utilizzate durante l'arricchimento dei metadati per aumentare l'accuratezza dei consigli di assegnazione dei termini di business. Possono essere visti come una controparte sintattica dei termini di business semantici.
Le classi di dati possono essere utilizzate per definire le regole utilizzabili come regole di protezione dei dati e regole di qualità dei dati. Svolgono anche un ruolo nella qualità dei dati per trovare voci sospette che potrebbero non essere corrette.
Quando si creano risorse utente della classe di dati personalizzate, è possibile utilizzare i dati corrispondenti per specificare come classificare i dati automaticamente. È anche possibile aggiungere risorse utente correlate come classificazioni e termini di business. Tali termini di business vengono quindi suggeriti per essere assegnati quando una classe di dati viene assegnata a una colonna in un asset di dati.
Nei cataloghi gestiti, gli asset di dati che contengono dati tabulari vengono creati automaticamente il profilo e le classi di dati assegnate. Nei cataloghi non gestiti, è possibile scegliere di creare il profilo di un asset di dati relazionale e scegliere quali classi di dati assegnare. I profili per gli asset di dati non strutturati vengono creati automaticamente quando si aggiungono tali asset a un catalogo, indipendentemente dal fatto che le politiche siano applicate o un progetto. Tutti gli utenti del catalogo possono visualizzare le classi di dati nell'anteprima dell'asset nelle pagine Panoramica e Profilo dell'asset.