Revise y evalúe las posibles coincidencias de registros en los datos de entidad. Tome decisiones de enlace o desenlace para mejorar la calidad de los datos y aumentar la confianza en los datos de entidad.
Utilice las capacidades de calidad de datos de IBM Cloud Pak for Data y el servicio IBM Match 360 para identificar, comprender, escalar, corregir y prevenir problemas de calidad de datos dentro de los datos de su entidad.
Contenido de este tema:
- Antes de empezar
- Visualización de la calidad de los datos de los activos y la confianza de las entidades
- Generación de tareas para posibles problemas de coincidencia
- Realización de tareas para remediar coincidencias potenciales
Antes de empezar
Para poder empezar a generar posibles tareas de coincidencia y remediarlas, un usuario ingeniero de datos debe haber completado las tareas siguientes:
- Habilite el rango de revisión administrativa y configure los umbrales de revisión administrativa y enlace automático. Para obtener más información, consulte Personalizar y fortalecer el algoritmo de coincidencia.
- Configure y active el flujo de trabajo de coincidencias potenciales para esta instancia de servicio. Para obtener más información, consulte Configuración de flujos de trabajo de IBM Match 360.
Visualización de la calidad de los datos de activos y la confianza de las entidades
Los propietarios y colaboradores de proyectos pueden ver información de calidad de datos para sus activos de datos. La información de calidad de datos se resume en una serie de puntuaciones de dimensión a las que puede acceder desde la pestaña de calidad de datos de activos del proyecto.
Una de las dimensiones que contribuye a la evaluación de la calidad de los datos es la confianza de las entidades. La dimensión de confianza de entidad sólo se notifica para los activos de datos de entidad IBM Match 360 conectados. La puntuación de confianza de entidad representa el porcentaje de entidades de datos maestros en el sistema que IBM Match 360 está seguro de que son correctas y están completas.
Puede mejorar la puntuación de confianza de entidad de un activo ajustando el algoritmo de coincidencia o remediando posibles problemas de coincidencia.
Para obtener más información sobre la calidad de datos, consulte Información de calidad de datos para activos de datos.
Si la puntuación de confianza de entidad del activo es baja, los datos pueden beneficiarse de la generación y corrección de algunas tareas de coincidencias potenciales.
Para ver la información de calidad de datos y la puntuación de confianza de entidad:
- En el menú de navegación Cloud Pak for Data , seleccione Proyectos > Todos los proyectos. En la página Proyectos, seleccione el proyecto IBM Match 360 .
- Pulse el separador Activos del proyecto y, a continuación, seleccione el activo de datos maestros conectado para el que desea ver el análisis de calidad de datos.
- Seleccione la pestaña Calidad de datos . El informe de calidad de datos puede tardar algún tiempo en generarse y visualizarse.
- Cuando el informe de calidad de datos esté disponible, revise la puntuación de confianza de entidad.
Generación de tareas para posibles problemas de coincidencia
Antes de poder revisar y remediar problemas potenciales dentro de las entidades coincidentes en los datos, debe generar algunas tareas de coincidencia potenciales. Puede generar tareas a partir del conjunto de datos completo o a partir de un conjunto de resultados de búsqueda para limitar el ámbito de las tareas. Por ejemplo, puede optar por centrar las tareas de remediación en una determinada región geográfica para evitar sobrecargar las bandejas de entrada de tareas de los encargados de datos.
- Permisos necesarios
- Para crear y corregir posibles tareas de coincidencia, debe ser miembro del ingeniero de datos o del grupo de usuarios de encargado de datos para el servicio IBM Match 360 .
Para generar posibles tareas de corrección de coincidencias:
En el menú de navegación Datos maestros, haga clic en Buscar ' para abrir la página de búsqueda de datos maestros.
Opcionalmente, ejecute una búsqueda para limitar el ámbito de los datos. Para obtener más información sobre la búsqueda, consulte Exploración de entidades y registros de datos maestros en IBM Match 360.
Pulse Crear tareas.
Defina los parámetros de la creación de la tarea de remediación.
- Defina si desea crear tareas para todos los datos o los resultados de la búsqueda actual (si procede).
- Seleccione los tipos de entidades a incluir en estas tareas.
- Defina cuántas tareas desea crear durante esta acción.
Pulse Crear tareas para empezar a generar las tareas de remediación.
Cuando las tareas están preparadas, aparecen como tareas Remediar coincidencias potenciales en las bandejas de entrada de tareas de los usuarios asignados. Las asignaciones de usuario se definen en la configuración del flujo de trabajo.
Si se actualiza una entidad que se ha incluido en una tarea Remediar coincidencias potenciales generada, ya sea manualmente o a través del proceso coincidente, Cloud Pak for Data invalida y elimina automáticamente la tarea correspondiente. Si todavía existen posibles problemas de coincidencia después de la actualización coincidente, puede volver a crear las tareas repitiendo el procedimiento de generación de tareas.
Realización de tareas para remediar posibles coincidencias
Como usuario encargado de datos, cuando tenga problemas de coincidencia potenciales en la bandeja de entrada de tareas, puede reclamarlos y remediar los problemas de calidad de datos identificados.
Para solucionar posibles problemas de coincidencia:
En el menú de navegación de Cloud Pak for Data , elija Gobernabilidad > Bandeja de entrada de tareas. La bandeja de entrada de tareas se abre para mostrar las tareas asignadas o completadas.
Compruebe si tiene alguna tarea Remediar coincidencias potenciales en la bandeja de entrada.
Haga clic en el icono de filtro " " para acceder a las opciones de filtro que puede utilizar para limitar el alcance de su bandeja de entrada. Por ejemplo, para mostrar sólo las tareas de remediación: en Tipo de tarea, seleccione Correccióny, a continuación, pulse Aplicar. También puede ordenar la bandeja de entrada de tareas por fecha de vencimiento o fecha asignada.
Para empezar a trabajar en una tarea, ábralo y pulse Reclamar tarea. Cuando reclama una tarea, el sistema impide que otros usuarios la trabajen en ella.
Revise los detalles de resumen de la tarea.
Pulse Remediar problemas para empezar a comparar los registros identificados por la tarea. Se abre una vista gráfica, que muestra una representación visual de todos los registros y entidades implicados en esta tarea de coincidencia potencial. Las coincidencias potenciales entre registros se representan como líneas de puntos.
Opcionalmente, pulse cada registro para ver sus detalles.
En el panel de coincidencias potenciales, verá un elemento para cada decisión de coincidencia potencial incluida en esta tarea. Pulse cada elemento para revisar los detalles. Se le mostrará una comparación lado a lado de los registros involucrados para ayudarle a tomar su decisión.
Si ve un mensaje que indica Acción masiva disponible, el sistema ha determinado que podría ser posible tomar una decisión masiva ( Enlace o Desenlazar) que se aplique a todos los problemas de esta tarea. Pulse Vista previa para ver una visualización del aspecto que tendrán los cambios antes de tomar la decisión.
Pulse Mostrar entidades para expandir el panel de comparación.
Para cada decisión de la tarea, puede elegir qué acción realizar: enlazar manualmente (Enlace), desenlazar manualmente (Desenlazar) u omitir el problema (Omitir). Si es posible, el sistema proporcionará una recomendación inteligente, proporcionándole una puntuación de confianza para cada recomendación.
Antes de tomar la decisión final, también puede pulsar Vista previa para ver una visualización del aspecto que tendrá la entidad y la estructura de registro.
Tome su decisión y, a continuación, confírmela en el modal pulsando Enlazar, Desenlazaro Omitir.
Sugerencia: Los cambios todavía no se han aplicado a los datos del sistema. Pulse Enviar para aplicar los cambios.Pulse Enviar para aplicar los cambios y completar esta tarea. Si pulsa Rechazar, no se realiza ningún cambio.
En la bandeja de entrada de tareas, pulse Completado para ver una lista de todas las tareas que ha completado, incluidos los detalles sobre cada actividad que ha completado como parte de la tarea.
Más información
- Supervisión de tareas del flujo de trabajo
- Exploración de entidades y registros de datos maestros en IBM Match 360
- Mantener los vínculos entre registros y entidades
- Configuración de flujos de trabajo de datos maestros
- Personalizar y fortalecer el algoritmo de coincidencia
Tema principal: Exploración de datos maestros