Puede crear y gestionar reglas de calidad de datos para evaluar la calidad de los datos del proyecto.
Si tiene los permisos necesarios, puede gestionar las reglas de calidad de datos de estas maneras:
- Crear reglas de calidad de datos
- Editar una regla de calidad de datos
- Suprimir reglas de calidad de datos que ya no necesita
También puede completar estas tareas con las API en lugar de con la interfaz de usuario. Los enlaces a estas API se listan en la sección Más información .
- Servicios necesarios
- IBM Knowledge Catalog
- DataStage o DataStage as a Service Anywhere '
' Con DataStage, puede ejecutar reglas de calidad de datos en las regiones soportadas. Con DataStage as a Service Anywhere, puede ejecutar reglas de calidad de datos fuera de IBM Cloud mediante motores remotos. Para obtener más información sobre la configuración de motores remotos, consulte la documentación deDataStage as a Service Anywhere.
Permisos necesarios
Para ver reglas de calidad de datos, debe tener al menos el rol Visor en el proyecto.
Para crear, editar o suprimir reglas de calidad de datos, debe tener el rol Gestionar activos de calidad de datos permiso de usuario y el rol Administrador o Editor en el proyecto.
Valores de proyecto para la ejecución de reglas
Los valores de nivel de proyecto determinan determinados aspectos de la ejecución de reglas de calidad de datos, por ejemplo, si los espacios finales de los valores de serie se ignoran en las comprobaciones de igualdad. Estos valores se aplican a todas las reglas de calidad de datos para un proyecto determinado. Puede comprobar o actualizar estos ajustes para cada proyecto utilizando la API IBM Knowledge Catalog Obtener la configuración del proyecto para las reglas de calidad de datos y Sustituir la configuración del proyecto para las reglas de calidad de datos.
Crear reglas de calidad de datos
Puede crear distintos tipos de reglas de calidad de datos:
Edición de reglas de calidad de datos
Puede editar una regla de calidad de datos para actualizar su descripción, la dimensión de calidad de datos seleccionada, cualquier asignación de términos de negocio o la configuración de la regla. También puede gestionar la lista de elementos relacionados.
Para editar una regla de calidad de datos, abra el activo y realice las acciones adecuadas:
Para actualizar la descripción o las dimensiones de calidad de los datos, haga clic en el icono Editar ' situado junto a la propiedad.
Para gestionar términos empresariales, vaya a la sección Artefactos de gobernabilidad del activo y añada o elimine términos según sea necesario.
Para asignar o suprimir reglas de gobernabilidad, vaya a la sección Artefactos de gobernabilidad del activo y añada o elimine las reglas de gobernabilidad según sea necesario.
Para actualizar la configuración de regla, pulse Editar regla. Cuando edita la configuración de reglas, también puede cambiar la forma en que se crea la regla: de utilizar definiciones de calidad de datos a utilizar sentencias SQL y viceversa. Sin embargo, cuando lo hace, se descarta toda la configuración de reglas existente y básicamente debe empezar desde cero.
También puede cambiar el tipo de salida. En función de la nueva selección, los valores de salida configurados se restablecen o se sobrescriben. La salida de regla que se ha escrito antes del cambio permanece intacta.
Para las reglas de calidad de datos que enlazan datos directamente, se añade una relación Valida la calidad de datos de con cada columna enlazada y con el activo que contiene la columna a la sección Elementos relacionados . Puede añadir manualmente activos y columnas con este tipo de relación a todos los tipos de reglas de calidad de datos. Cuando añade activos y columnas a reglas de calidad de datos con enlaces gestionados externamente o reglas de calidad de datos basadas en SQL con esta relación, estos tipos de reglas contribuyen a las puntuaciones de calidad de datos del activo o columna correspondiente. La puntuación y los problemas generados por la regla se notifican para todos los activos y columnas que están enlazados con el tipo de relación Valida la calidad de datos de .
Cuando vea una regla de calidad de datos, puede hacer clic en el icono de información ' ' para ver más detalles, como la configuración de salida o los activos relacionados.
Supresión de reglas de calidad de datos
Puede suprimir una regla de calidad de datos de una de estas maneras:
- En el proyecto, seleccione la regla de calidad de datos y pulse Suprimir.
- Abra la regla de calidad de datos y seleccione Suprimir en el menú de desbordamiento situado junto al nombre de la regla de calidad de datos.
Cuando suprime una regla de calidad de datos, su historial de ejecución, los flujos y trabajos de DataStage asociados también se suprimen del proyecto. Las tablas de salida en el proyecto y en la base de datos se conservan. Los problemas devueltos por esta regla de calidad de datos se eliminan y se vuelven a calcular la calidad de los datos y las puntuaciones de dimensión.
Más información
Próximos pasos
Tema padre: Gestión de calidad de datos