Para añadir datos al repositorio de linaje, es necesario seleccionar la instancia Cloud Object Storage, crear la definición del origen de datos y crear la importación de metadatos.
Permiso necesario
Debe tener el siguiente permiso de usuario:
- Gestionar el linaje de los datos
Requisitos previos
La capacidad de linaje de datos no está disponible por defecto. Debe instalar el servicio IBM Knowledge Catalog con el servicio IBM Manta Data Lineage activado. Para más información sobre cómo activar el linaje de datos, véase ' Activar el linaje de datos.
Necesita un proyecto para almacenar los metadatos importados de los activos de datos. Para más información, consulte Crear un proyecto.
Configuración del linaje de datos
Seleccione la instancia de Cloud Object Storage para almacenar los metadatos de linaje de datos. Sólo puede seleccionar su instancia de almacenamiento una vez. No puedes cambiarlo después. Asegúrese de que el almacenamiento de objetos está configurado para permitir a los usuarios crear catálogos y proyectos. Consulte Configuración de IBM Cloud Object Storage para su uso con Cloud Pak for Data as a Service.
Para definir el almacenamiento:
- Vaya a la página Configuraciones y ajustes o Linaje de datos y haga clic en Configuración del linaje de datos.
- Selecciona tu almacenamiento de la lista y guarda los cambios.
Preparación de datos para rellenar el repositorio de linajes
Antes de visualizar el linaje, debe rellenar su repositorio de linaje de datos de la siguiente manera:
- Cree una definición de fuente de datos y una conexión.
Una definición de fuente de datos es un activo que funciona como un identificador único estable para la ubicación de una fuente de datos, como una base de datos relacional. Las definiciones de fuentes de datos utilizan puntos finales para identificar la fuente de datos. Para la mayoría de los tipos de fuentes de datos, un endpoint es la combinación del nombre de host o dirección IP, el número de puerto y el nombre de la base de datos o identificador de instancia. Para obtener más información y un procedimiento, consulte Creación de una definición de fuente de datos en la lista Definición de fuente de datos.
Se utiliza una conexión para conectarse a la fuente de datos externa. Véase, Añadir conexiones de plataforma. Para ver una lista de los conectores admitidos para el linaje de datos, consulte ' Fuentes de datos compatibles para el linaje de datos.
La asignación de la conexión a una definición de fuente de datos se realiza automáticamente. Cuando se crea primero una conexión y, a continuación, una definición de fuente de datos, la asignación puede tardar más tiempo.
- Navegue hasta su proyecto y cree la importación de metadatos. Para obtener más información, consulte Creación de un activo de importación de metadatos e importación de metadatos.
- Después de que el trabajo de importación de metadatos haya tenido éxito, vaya a la pestaña ' Datos > Linaje de datos > Ver linaje para comprobar si sus datos son visibles en el árbol del repositorio.
Más información
- Protección de datos con definiciones de fuentes de datos
- Importar metadatos
- Fuentes de datos compatibles para la curación y la calidad de los datos
- Visualización del linaje de datos
- Gestión del linaje de datos
Tema principal: Linaje de datos