Las clases de datos describen el tipo de datos contenidos en activos de datos, como por ejemplo campos de datos o columnas de tabla, por ejemplo, ciudad, número de teléfono o número de tarjeta de crédito. IBM Knowledge Catalog proporciona un conjunto de clases de datos predefinidas.
Las clases de datos son algoritmos que ayudan a las organizaciones a asignar términos empresariales a elementos de datos, esta asignación se basa en la sintaxis de los datos. Las clases de datos se utilizan durante el enriquecimiento de metadatos para aumentar la precisión de las recomendaciones de asignación de términos de negocio. Se pueden ver como una contrapartida sintáctica a los términos de negocio semánticos.
Las clases de datos se pueden utilizar para formular reglas procesables como, por ejemplo, reglas de protección de datos y reglas de calidad de datos. También desempeñan un papel en la calidad de los datos para encontrar entradas sospechosas que podrían no ser correctas.
Cuando cree artefactos de clase de datos personalizados, puede utilizar datos coincidentes especificar cómo clasificar los datos automáticamente. También puede añadir artefactos relacionados, tales como clasificaciones y términos empresariales. A continuación, se sugiere asignar tales términos empresariales cuando se asigna una clase de datos a una columna en un activo de datos.
En los catálogos gobernados, los activos de datos que contienen datos en formato de tabla se perfilan automáticamente y se les asignan clases de datos. En los catálogos no gobernados, puede elegir perfil de un activo de datos relacional y elegir qué clases de datos asignar. Los perfiles para los activos de datos no estructurados se crean automáticamente cuando añade estos activos a un catálogo, independientemente de si se aplican políticas o un proyecto. Todos los usuarios del catálogo pueden ver las clases de datos en la vista previa de activos en las páginas Visión general y Perfil del activo.