Importar metadatos
Puede capturar e importar metadatos de activos e información sobre el linaje de los datos de su organización. Estos datos pueden proceder de fuentes muy diversas. Al importar metadatos de activos, se crean activos.
- Servicios necesarios
- IBM Knowledge Catalog
- Manta Data Lineage (para importar metadatos de linaje)
- Cloud Object Storage (para importar metadatos de linaje)
- Permisos necesarios
- Para crear, gestionar y ejecutar una importación de metadatos, debe tener el rol Admin o el rol Editor en el proyecto.
- Para importar metadatos en un catálogo, también debe tener el rol de Administrador o de Editor en el catálogo en el que desea importar.
- Para configurar Cloud Object Storage para almacenar metadatos de linaje, debe tener el permiso Gestionar linaje de datos.
- Conexiones soportadas
- Puede importar activos de las fuentes de datos que se enumeran en Fuentes de datos compatibles para la curación y la calidad de los datos.
Visión general
El proceso de importación de metadatos implica la configuración de la conexión con la fuente de datos y la especificación de parámetros para el trabajo de importación de metadatos. Dependiendo del tipo de metadatos que importe, ya sean metadatos de activos o metadatos de linaje, podría ser necesaria una configuración previa.
Requisitos previos: Configuración del linaje de datos
Si desea importar metadatos de linaje, debe activar y configurar el linaje de datos.
- Habilite la función de linaje de datos en la configuración de funciones de servicio IBM Knowledge Catalog. Para conocer los pasos exactos, consulte Configuración del servicio IBM Knowledge Catalog: Habilitar el linaje de datos.
- Seleccione una instancia Cloud Object Storage para almacenar los datos de linaje:
- En el menú de navegación Cloud Pak for Data, vaya a Administración > Configuraciones y ajustes y abra Configuración de linaje de datos.
- Seleccione una instancia de Cloud Object Storage en la que desee almacenar los datos de linaje. Para obtener más información sobre IBM Cloud Object Storage, consulte IBM Cloud Object Storage en Cloud Pak for Data as a Service.
Pasos para importar metadatos
Los siguientes pasos proporcionan una visión general sobre el proceso de importación de metadatos. Siga los enlaces de cada paso para obtener más información.
- Crear una definición de fuente de datos.
- Crear una conexión con la fuente de datos en un proyecto.
- Crear una importación de metadatos.
Cada fuente de datos requiere diversos detalles de conexión y configuración. Puede encontrar esta información en cada tema de conexión en la sección Conectores y en la sección Conectores compatibles para la importación de linajes. Para comprobar de qué fuentes de datos puede importar metadatos, consulte Fuentes de datos compatibles para la curación y la calidad de los datos.
Cuando se crea una importación de metadatos, el proceso de importación de metadatos se inicia inmediatamente, a menos que se haya programado para que se ejecute a una hora determinada o se haya configurado para que no se ejecute en absoluto.
Tipos de metadatos
Puede importar estos tipos de metadatos:
- Metadatos de activos
- Los metadatos de activos proporcionan la información necesaria para crear un activo en un proyecto o catálogo. Los metadatos de los activos proporcionan detalles de los activos, relaciones y la vista previa de su contenido. En el caso de los activos de datos, los metadatos también permiten perfilar los datos, analizar su calidad y facilitar el acceso a las personas que trabajan con ellos.
- Metadatos de linaje
- Los metadatos de linaje proporcionan la información de linaje para el gráfico de linaje de datos. El linaje de los datos muestra de dónde proceden, cómo cambian y hacia dónde se mueven con el tiempo.
Tipos de activos
Puede crear los siguientes tipos de activos importando metadatos:
- Activos de datos
- Tablas de datos o archivos de una conexión. Si desea ejecutar reglas de enriquecimiento de metadatos o de calidad de datos en los activos importados, impórtelos a un proyecto.
- Libros de copias COBOL
- La estructura de datos de un programa COBOL. Puede importar copybooks Cobol en proyectos y catálogos. Estos activos no pueden descargarse, perfilarse, enriquecerse mediante el enriquecimiento de metadatos ni utilizarse en Data Refinery.
- Activos del guión de transformación
- Las transformaciones de datos que cambian el formato, la estructura o los valores de los datos y que suelen formar parte de los procesos ETL (extracción, transformación y carga).
Próximos pasos
Más información
- Guía de aprendizaje de entramado de datos: Curar datos de alta calidad
- Fuentes de datos compatibles para la curación y la calidad de los datos
- Marcar un proyecto como confidencial
- IBM Manta Data Lineage en Cloud Pak for Data as a Service
Tema padre: Curación de datos