Dimensiones de calidad de datos

Última actualización: 10 abr 2025
Dimensiones de calidad de datos

Las dimensiones de calidad de datos describen una característica medible de los datos y ayudan a definir los requisitos de calidad de los datos. Utilice las dimensiones de calidad de datos para determinar los resultados esperados de la evaluación de calidad de datos, ya sea la evaluación inicial o la supervisión continua.

El estado en el que desea que estén los datos normalmente se puede definir como apto para su uso, libre de defectos, corresponde a la especificacióno que cumple las expectativas y requisitos. Cuando mide la calidad de los datos, compara el estado real de los datos con este estado deseado. Los estándares, las expectativas y los requisitos que son importantes para los procesos de negocio se expresan como características o dimensiones de los datos.

La Data Management Association (DAMA ) International publicó un documento que describe 6 dimensiones fundamentales de la calidad de los datos: Exactitud, Integridad, Coherencia, Puntualidad, Unicidad, Validez

Además de estas dimensiones básicas, IBM Knowledge Catalog proporciona la dimensión Homogeneidad.

Todas estas dimensiones pueden evaluarse mediante la ejecución de controles de calidad de datos como parte del enriquecimiento de metadatos o mediante la ejecución de reglas de calidad de datos individuales.

Dimensiones de calidad de datos principales
Dimensión Descripción Comprobaciones de calidad de datos predefinidas que identifican problemas asociados a esta dimensión
Precisión Los valores de datos están lo más cerca posible de los valores reales. Ninguno.
Integridad Todos los valores de datos necesarios están presentes. Valores perdidos inesperados
Coherencia Los valores de datos dentro de una columna cumplen con una regla. Mayúsculas y minúsculas incoherentes
Representación incoherente de los valores perdidos
Valores sospechosos
Homogeneidad Los datos de un activo de datos son uniformes y coherentes a lo largo del tiempo. Todos los puntos de datos comparten características, formatos o estructuras similares. Ninguno.
Puntualidad Los datos representan la realidad desde un punto en el tiempo requerido. Ninguno.
Exclusividad Los valores distintos sólo aparecen una vez. Valores duplicados inesperados
Validez Los datos se ajustan al formato, tipo o rango de su definición. Infracciones de clase de datos
Infracciones de tipo de datos
Infracciones de formato
Valores fuera de rango

Puede crear sus propias dimensiones de calidad de datos utilizando la API de IBM Knowledge Catalog Crear una dimensión de calidad de datos.

Más información

Tema padre: Gestión de calidad de datos