Enriquezca los activos de datos con información que ayude a los usuarios a encontrar datos más rápidamente, a decidir si los datos son apropiados para la tarea que tienen entre manos, si pueden confiar en los datos y cómo trabajar con ellos. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas.
Los representantes de datos crean perfiles de activos para comprender el significado de los datos y evaluar su calidad. Además, añaden contexto de negocio a los datos asignando términos e identifican relaciones entre tablas. El enriquecimiento de metadatos automatiza este proceso aumentando la productividad del representante de datos.
Los datos solo son útiles si se confía en su contexto, contenido y calidad. Para mantenerlos de esa manera, los datos deben ser evaluados continuamente y se debe tomar la medidas de remediación apropiadas si es necesario. Los encargados de datos pueden configurar trabajos recurrentes para realizar un seguimiento continuo de los cambios en el contenido y la estructura de los datos y, a continuación, analizar sólo los datos que han cambiado.
La información que se añade a los activos mediante el enriquecimiento de metadatos también ayuda a proteger los datos debido a que se puede utilizar en las políticas de protección de datos para enmascarar datos o para restringir el acceso.
- Servicios necesarios
IBM Knowledge Catalog
DataStage para análisis avanzado de claves o relaciones y perfiles avanzados- Formato de los datos
Tablas de orígenes de datos relacionales y no relacionales
Archivos cargados desde el sistema de archivos local o desde conexiones basadas en archivos a los orígenes de datos, con estos formatos: CSV, TSV, Avro, Parquet, Microsoft Excel (xls, xlsm y xlsx; sólo la primera hoja de un libro de trabajo se ha perfilado para los archivos cargados desde el sistema de archivos local.) Estos archivos de datos estructurados no se perfilan:
- Archivos dentro de un activo de carpeta conectado. Los archivos a los que se puede acceder desde un activo de carpeta conectado no se tratan como activos y no se perfilan.
- Archivos dentro de un archivo de archivado, por ejemplo, un archivo .zip. El activo de datos hace referencia al archivo de archivador sin que se perfilen los archivos comprimidos.
Puede enriquecer los activos de datos de los orígenes de datos listados en Orígenes de datos soportados para la ordenación y la calidad de los datos.
- Tamaño de datos
Cualquiera; los conjuntos de datos de conexiones basadas en archivo no pueden tener más de 4.999 columnas
- Permisos necesarios
Para crear, gestionar y ejecutar un enriquecimiento de metadatos, debe tener el rol Admin o el rol Editor en el proyecto, y debe tener al menos acceso de vista a las categorías que desea utilizar en el enriquecimiento. Asimismo, debe tener autorización para acceder a los orígenes de datos de los activos de datos que se han de enriquecer.
Si alguna de estas conexiones está bloqueada, se le pedirá que introduzca sus credenciales personales. Este es un paso único que desbloquea permanentemente las conexiones para usted.
Todas las operaciones que se ejecutan como parte de un enriquecimiento de metadatos requieren credenciales para la autorización segura. Normalmente, la clave de API de usuario se utiliza para ejecutar estas operaciones de larga ejecución sin interrupción. Si las credenciales no están disponibles al crear un enriquecimiento de metadatos o al intentar ejecutar cualquier tipo de enriquecimiento, se le solicitará que cree una clave de API. A continuación, dicha clave de API se guarda como credenciales de tarea. Consulte Gestión de la clave de API de usuario.
También puede crear, editar, ejecutar o suprimir enriquecimientos de metadatos con las API en lugar de la interfaz de usuario. Los enlaces a estas API se listan en la sección Más información .
Visión general del enriquecimiento de metadatos
Los activos de datos enriquecedores requieren el proceso siguiente:
Identifique los activos de datos que desea enriquecer.
En un proyecto, cree un activo de enriquecimiento de metadatos para configurar los detalles de enriquecimiento como el ámbito y el objetivo del enriquecimiento, y la planificación para el trabajo de enriquecimiento.
Ejecute el trabajo de enriquecimiento.
Para cada activo de datos incluido en el enriquecimiento, trabaje con los resultados en el activo de enriquecimiento de metadatos:
- Identifique anomalías y problemas de calidad y tome las medidas adecuadas para remediar cualquier problema.
- Revise el contenido generado como, por ejemplo, los nombres de visualización o las descripciones generadas por IA.
- Compruebe las asignaciones de términos y evalúe y actúe sobre las sugerencias de términos.
- Gestione las asignaciones de clases de datos a nivel de columna.
- Gestionar las clasificaciones.
- Identificar y establecer claves primarias y relaciones.
- Detecte el solapamiento o los datos redundantes.
También puede acceder a los resultados del enriquecimiento y trabajar con ellos en el perfil de cada activo individual. Consulte Perfiles de activos. La información de calidad detallada está disponible en la pestaña Calidad de datos de un activo.
Vuelva a evaluar los activos en cuestión.
Publique los activos de datos con los resultados según sea necesario.
Puede realizar la mayoría de las tareas con las API en lugar de la interfaz de usuario. Los enlaces a IBM Knowledge Catalog API se enumeran para cada tarea aplicable.
Aunque puede añadir activos conectados individuales a un enriquecimiento de metadatos, el enriquecimiento de metadatos está pensado para el proceso masivo de activos de datos añadidos al proyecto a través de la importación de metadatos.
Para garantizar un uso coherente de las opciones de enriquecimiento, puede configurar valores predeterminados para todos los activos de enriquecimiento de metadatos de un proyecto. Para abrir la página de configuración, vaya a Gestión > Enriquecimiento de metadatos. Como alternativa, puede abrir un activo de enriquecimiento de metadatos existente y hacer clic en Configuración predeterminada.
Para la gestión de la carga de trabajo, la ejecución de trabajos de enriquecimiento de metadatos puede restringirse a ventanas de ejecución de trabajos. El administrador del proyecto puede definir estas ventanas en Gestionar > Ventanas de ejecución de trabajos.
Más información
Próximos pasos
Tema principal: Proceso de datos