Datenklassen beschreiben den Typ von Daten, die in Datenassets enthalten sind, z. B. Datenfelder oder Tabellenspalten, z. B. Stadt, Telefonnummer oder Kreditkartennummer. IBM Knowledge Catalog bietet eine Reihe von vordefinierten Datenklassen.
Datenklassen sind Algorithmen, die Organisationen bei der Zuordnung von Geschäftsbegriffen zu Datenelementen unterstützen, wobei diese Zuordnung auf der Syntax der Daten basiert. Datenklassen werden während der Metadatenaufbereitung verwendet, um die Genauigkeit von Empfehlungen für die Zuordnung von Geschäftsbegriffen zu erhöhen. Sie können als syntaktische Entsprechung der semantischen Geschäftsbegriffe betrachtet werden.
Datenklassen können verwendet werden, um umsetzbare Regeln wie Datenschutzregeln und Datenqualitätsregeln auszuformulieren. Sie spielen auch eine Rolle bei der Datenqualität, um verdächtige Einträge zu finden, die möglicherweise nicht korrekt sind.
Wenn Sie benutzerdefinierte Datenklassenartefakte erstellen, können Sie übereinstimmende Daten verwenden, um anzugeben, wie Daten automatisch klassifiziert werden. Sie können außerdem zugehörige Artefakte wie Klassifikationen und Geschäftsbegriffe hinzufügen. Diese Geschäftsbegriffe werden dann für die Zuordnung vorgeschlagen, wenn eine Datenklasse einer Spalte in einem Datenasset zugewiesen wird.
In regulierten Katalogen werden Datenassets, die Tabellendaten enthalten, automatisch mit einem Profil versehen und Datenklassen zugeordnet. In nicht regulierten Katalogen können Sie ein Profil für ein relationales Datenasset erstellen und auswählen, welche Datenklassen zugewiesen werden. Wenn Sie einem Katalog oder Projekt unstrukturierte Datenassets hinzufügen, werden für solche Assets automatisch Profile erstellt, unabhängig davon, ob Richtlinien durchgesetzt werden. Alle Katalogbenutzer können die Datenklassen in der Assetvorschau auf den Seiten Übersicht und Profil des Assets anzeigen.