Dimensiones de calidad de datos
Las dimensiones de calidad de datos describen una característica medible de los datos y ayudan a definir los requisitos de calidad de los datos. Utilice las dimensiones de calidad de datos para determinar los resultados esperados de la evaluación de calidad de datos, ya sea la evaluación inicial o la supervisión continua.
El estado en el que desea que estén los datos normalmente se puede definir como apto para su uso, libre de defectos, corresponde a la especificacióno que cumple las expectativas y requisitos. Cuando mide la calidad de los datos, compara el estado real de los datos con este estado deseado. Los estándares, las expectativas y los requisitos que son importantes para los procesos de negocio se expresan como características o dimensiones de los datos.
La Asociación Data Management (DAMA) International publicó un artículo que describe 6 dimensiones principales de la calidad de los datos:
Dimensión | Descripción | Comprobaciones de calidad de datos predefinidas que identifican problemas asociados a esta dimensión |
---|---|---|
Precisión | Los valores de datos están lo más cerca posible de los valores reales. | Ninguno. |
Integridad | Todos los valores de datos necesarios están presentes. | Valores perdidos inesperados |
Coherencia | Los valores de datos dentro de una columna cumplen con una regla. | Mayúsculas y minúsculas incoherentes Representación incoherente de los valores perdidos Valores sospechosos |
Puntualidad | Los datos representan la realidad desde un punto en el tiempo requerido. | Ninguno. |
Exclusividad | Los valores distintos sólo aparecen una vez. | Valores duplicados inesperados |
Validez | Los datos se ajustan al formato, tipo o rango de su definición. | Infracciones de clase de datos Infracciones de tipo de datos Infracciones de formato Valores fuera de rango |
Puede crear sus propias dimensiones de calidad de datos utilizando la API de IBM Knowledge Catalog Crear una dimensión de calidad de datos.
El estado en el que desea que estén los datos normalmente se puede definir como apto para su uso, libre de defectos, corresponde a la especificacióno que cumple las expectativas y requisitos. Cuando mide la calidad de los datos, compara el estado real de los datos con este estado deseado. Los estándares, las expectativas y los requisitos que son importantes para los procesos de negocio se expresan como características o dimensiones de los datos.
La Asociación Internacional para la Gestión de Datos ( Data Management, DAMA) publicó un documento que describe seis dimensiones fundamentales de la calidad de los datos: precisión, integridad, coherencia, puntualidad, singularidad y validez
Además, IBM Knowledge Catalog proporciona la dimensión Homogeneidad.
Todas estas dimensiones pueden evaluarse mediante la ejecución de controles de calidad de datos como parte del enriquecimiento de metadatos o mediante la ejecución de reglas de calidad de datos individuales.
La siguiente tabla describe las dimensiones de la calidad de los datos y enumera los controles de calidad de los datos en el enriquecimiento de metadatos que pueden identificar problemas asociados a una dimensión específica:
Dimensión | Descripción | Tipos de controles de calidad de datos |
---|---|---|
Precisión | Los valores de datos están lo más cerca posible de los valores reales. | Ninguno. |
Integridad | Todos los valores de datos necesarios están presentes. | Comprobación de integridad |
Coherencia | Los valores de datos dentro de una columna cumplen con una regla. | Comprobación del estilo de capitalización Comprobación de la representación de valores faltantes Comprobación de integridad referencial ( IBM Knowledge Catalog Premium ) Comprobación de valores sospechosos |
Homogeneidad | Los datos son similares y coherentes a lo largo del tiempo. | Estabilidad histórica ( IBM Knowledge Catalog Premium ) |
Puntualidad | Los datos representan la realidad desde un punto en el tiempo requerido. | Ninguno. |
Exclusividad | Los valores distintos sólo aparecen una vez. | Comprobación de exclusividad |
Validez | Los datos se ajustan al formato, tipo o rango de su definición. | Comprobación de la clase de datos Comprobación del tipo de datos Comprobación de formato Comprobación de longitud Comprobación de valores posibles Comprobación de alcance Comprobación de expresiones regulares |
Más información
- Resultados de análisis de calidad de datos
- Comprobaciones de calidad de datos predefinidas
- Configuración de flujos de trabajo de datos maestros
- API de IBM Knowledge Catalog : Listar todas las dimensiones de calidad de datos
- API de IBM Knowledge Catalog : Crear una dimensión de calidad de datos
Tema padre: Gestión de calidad de datos