Gestión de importaciones de metadatos

Puede importar metadatos técnicos asociados con los activos de datos de su organización en un proyecto o un catálogo para inventariar, evaluar y catalogar estos activos.

Los metadatos técnicos describen la estructura de los objetos de datos. Estos metadatos ayudan a los usuarios a decidir si los datos son adecuados para la tarea en cuestión, si pueden confiar en los datos y cómo trabajar con ellos.

Los metadatos que se importan pueden enriquecerse posteriormente con otra información para ayudar a los usuarios a encontrar los datos más rápidamente y utilizarlos con confianza. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas.

Al importar metadatos, añade activos de datos a un proyecto o a un catálogo. Si importa los activos a un proyecto, no son visibles en ningún catálogo hasta que los publique. Después de compartirlos en un catálogo, otros usuarios de catálogo pueden trabajar con estos activos.

Permisos necesarios Para crear y ejecutar una importación de metadatos, debe tener el rol de Administrador o de Editor en el proyecto. Para importar metadatos en un catálogo, también debe tener el rol de Administrador o de Editor en el catálogo en el que desea importar.

Visión general de la importación

{: #metadata-import-overview}Importar los metadatos requiere el proceso siguiente:

  • Identifique el origen de datos del que desea importar. Es posible que ya tenga una conexión con este origen de datos definida. De lo contrario, asegúrese de que tiene las credenciales para conectarse a él. Para obtener una lista de las conexiones soportadas, consulte el paso 4 de las instrucciones para añadir un activo de importación de metadatos.
  • En un proyecto, cree un activo de importación de metadatos para configurar los detalles de importación como el ámbito y el destino de la importación y la planificación del trabajo de importación.
  • Importe activos al proyecto o al catálogo. Cuando accede a un activo de datos importado, los datos se recuperan de forma dinámica del origen de datos.
  • Analice y obtenga una vista previa de los metadatos importados y compártalos en el catálogo si ha importado los metadatos a un proyecto. Puede crear perfiles para activos individuales de uno en uno desde la pestaña Perfil de cada activo. También puede crear perfiles para varios activos de datos en paralelo y añadirles contexto empresarial creando y ejecutando un activo de enriquecimiento de metadatos.

Mire este breve vídeo para ver cómo importar los metadatos de activos desde un origen externo a un proyecto de Watson Studio.

Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.

Creación de un activo de importación de metadatos e importación de metadatos

{: #create-metadata-import-job} Para crear un activo de importación de metadatos y un trabajo para importar metadatos en un proyecto o un catálogo:

  1. Abra un proyecto y pulse Nuevo activo > Importación de metadatos. Después de crear la primera importación de metadatos de este modo, puede añadir nuevos activos de importación de metadatos desde la página Activo del proyecto.
  2. Especifique un nombre para la importación de metadatos. Opcionalmente, puede proporcionar una descripción.

  3. De manera opcional, seleccione las etiquetas que se van a asignar al activo de importación de metadatos para simplificar la búsqueda. Para crear nuevas etiquetas, especifique el nombre de etiqueta y pulse Intro.

  4. Seleccione un activo de conexión existente como origen de los datos o pulse Crear una nueva conexión y crear un activo de conexión.

    Puede importar metadatos desde los orígenes de datos que se muestran en la Tabla 1.

  5. Seleccione el destino de importación. Puede importar metadatos al proyecto en el que está trabajando o en un catálogo. Cuando elige importar a un catálogo, puede elegir uno de todos los catálogos que están disponibles para usted.

    Importe los metadatos en un proyecto para el análisis antes de decidir qué activos compartir en un catálogo para que otros usuarios trabajen en ellos. Si conoce bien el contenido de los activos de datos, puede importar sus metadatos directamente en el catálogo.

  6. Pulse Siguiente.

  7. Defina un ámbito para la importación de metadatos. En función del tamaño y el contenido del origen de datos, es posible que no desee importar todos los activos, sino un subconjunto seleccionado. Puede incluir esquemas o carpetas completos, o profundizar hasta tablas o archivos individuales. Cuando selecciona un esquema o una carpeta, puede ver inmediatamente cuántos elementos contiene. Por lo tanto, puede decidir si desea incluir todo el conjunto o si un subconjunto sirve mejor a su propósito.

    1. Seleccione los elementos que desea incluir en la importación. Cuando haya terminado, pulse Seleccionar.
    2. Revise el ámbito seleccionado. Puede suprimir directamente activos del ámbito de datos o puede volver a trabajar en todo el ámbito pulsando Editar ámbito de datos.
    3. Cuando haya terminado de refinar el ámbito de datos, pulse Siguiente.
  8. Defina si desea ejecutar trabajos de importación planificados. Si no define una planificación, ejecute la importación cuando guarde el activo de importación de metadatos. Puede volver a ejecutar la importación manualmente en cualquier momento.

    Si selecciona ejecutar la importación en una planificación específica, defina la fecha y la hora en que desea que se ejecute el trabajo. Puede planificar ejecuciones únicas y recurrentes. Si planifica una sola ejecución, el trabajo se ejecutará exactamente una vez en el día y hora especificados. Si planifica ejecuciones recurrentes, el trabajo se ejecutará por primera vez en la indicación de fecha y hora indicada en la sección Repetir.

    Opcionalmente, cambie el nombre del trabajo de importación. El nombre predeterminado es metadata_import_name trabajo.

    Posteriormente puede acceder al trabajo de importación que cree desde el activo de importación de metadatos o desde la página Trabajos del proyecto. Consulte Trabajos.

  9. Revise la configuración de importación de metadatos. Para realizar cambios, pulse el icono Editar (icono de edición) en el mosaico y actualice los valores.

  10. Pulse Crear. El activo de importación de metadatos se añade al proyecto y se crea un trabajo de importación de metadatos. Si no ha configurado una planificación, la importación se ejecuta inmediatamente. Si ha configurado una planificación, la importación se ejecutará en la planificación definida.

    Importante: Los activos de la misma conexión que ya se han importado a través de una importación de metadatos diferente no se importan de nuevo, sino que se actualizan. Dichos activos ya no se muestran en la importación de metadatos inicial. Solo la importación de metadatos de ejecución más reciente contiene los activos.

Para perfilar, analizar y proporcionar contexto empresarial a los activos importados, cree un activo de enriquecimiento de metadatos e incluya el activo de importación de metadatos en el ámbito de datos.

Tabla 1. Importar conexiones

IBM Terceros
Analytics Engine HDFS
Cloud Object Storage
Compose for MySQL
Data Virtualization Manager for z/OS¹
Databases for MongoDB
Databases for PostgreSQL
Db2
Db2 Big SQL
Db2 for i
Db2 for z/OS
Db2 Hosted
Db2 on Cloud
Db2 Warehouse
Informix
Netezza Performance Server
SQL Query







Amazon RDS for MySQL
Amazon RDS for PostgreSQL
Amazon S3²
Apache HDFS
Apache Cassandra
Apache Hive
Box
Cloudera Impala
Generic S3
Google BigQuery²
Greenplum
MariaDB
Microsoft Azure Data Lake Store
Microsoft Azure SQL Database
Microsoft SQL Server
MongoDB
MySQL
Oracle
PostgreSQL
Salesforce.com
SAP ASE
SAP IQ
Snowflake
Teradata

{: caption="Conexiones soportadas para la importación de metadatos" caption-side="top"}{: #import-conns}

Notas:

¹ Con Data Virtualization Manager for z/OS, puede añadir datos y activos de libros de copias de COBOL de sistemas principales a catálogos en IBM Cloud Pak for Data. Los libros de copias son archivos que describen la estructura de datos de un programa COBOL. Data Virtualization Manager for z/OS le ayuda a crear tablas y vistas virtuales a partir de correlaciones de libros de copias de COBOL. A continuación, puede utilizar estas tablas y vistas virtuales para importar y catalogar datos de sistema principal desde sistemas principales a IBM Cloud Pak for Data en forma de activos de datos y activos de libros de copias de COBOL.

Los siguientes tipos de correlación no se importan: ACI, Catálogo, Natural

Restricción: No se pueden importar libros de copias COBOL de más de 1 MB.

Cuando finalice la importación, puede ir al catálogo para revisar los activos importados, incluidas las correlaciones de libros de copias de COBOL, las tablas virtuales y las vistas. Puede utilizar estos activos de la misma forma que otros activos de Cloud Pak for Data.

Para obtener más información, consulte Adición de activos de libro de copias COBOL.

² Este tipo de conexión debe crearse a nivel de proyecto y, a continuación, seleccionarse de la lista de conexiones existentes al crear una importación de metadatos. No puede crear una conexión de este tipo desde la importación de metadatos.

Visualización de la importación de metadatos

Los activos de importación de metadatos de {: #view-metadata-import} se muestran en la sección Importaciones de metadatos de la página Activos. Para ver un activo, pulse su nombre o seleccione Ver en el menú de acciones del activo.

Al ver el activo de importación de metadatos, puede ver la lista de activos importados con una ejecución del trabajo de importación asociado. Puede trabajar con estos activos, editar la importación de metadatos o volver a ejecutar la importación.

Para cada activo importado, puede ver la siguiente información:

  • El tipo de datos, como por ejemplo text/csv.
  • El contexto del activo, tal como el padre o la vía de acceso a archivo.
  • La fecha y hora en que se ha importado el activo por última vez.
  • El estado de importación, que puede ser Imported para datos importados correctamente, In progress o Removed si el activo no se ha podido volver a importar. Consulte Volver a ejecutar la importación.

Puede ver información adicional para un activo, publicarlo en un catálogo o suprimir el activo. Cuando suprime un activo de la lista de activos importados, se suprime del proyecto o catálogo en el que se ha importado, pero no del ámbito de importación de metadatos.

Cuando vuelve a importar activos, se renuevan los activos. Los activos existentes se actualizan, lo que significa que se fusionan los cambios de contenido. Se pueden añadir nuevos activos en el origen de datos, en función del ámbito definido. Si ha eliminado un activo del activo, proyecto o catálogo de importación de metadatos, el activo en cuestión se vuelve a importar a menos que lo haya eliminado del ámbito. Los activos que se han eliminado del ámbito de datos o que se han suprimido del origen de datos después de la última importación no se pueden volver a importar y tienen el estado Removed.

Puede trabajar con activos de datos importados exactamente de la misma forma que con los activos de datos conectados. A los activos importados se les asigna automáticamente una etiqueta que refleja el elemento padre del activo, si procede.

Para ver los detalles del activo de importación de metadatos, pulse el icono de información. Para editar el activo de importación de metadatos, pulse Editar importación de metadatos. Puede cambiar estos valores de configuración:

  • Detalles del activo, tales como el nombre del activo, la descripción o las etiquetas. Tenga en cuenta que cambiar el nombre de activo no cambia el nombre del trabajo de importación asociado. No puede cambiar la conexión o el destino de importación.
  • El ámbito de datos.
  • La planificación.

Volver a ejecutar la importación

{: #rerun-metadata-import}Si no ha configurado una planificación, puede volver a ejecutar manualmente la importación de metadatos en cualquier momento de varias maneras:

  • Abra el activo de importación de metadatos y seleccione Volver a importar activos.
  • Abra el activo de importación de metadatos y pulse el nombre de trabajo debajo del nombre de activo, que le llevará a la página de trabajo. Pulse el icono de ejecución en esta página.
  • Vaya a la página Trabajos del proyecto y ejecute el trabajo de importación desde allí.

Cuando vuelve a importar se renueva la información del activo. Los activos existentes se actualizan, lo que significa que se fusionan los cambios de contenido. Se pueden añadir nuevos activos en el origen de datos, en función del ámbito definido. Si ha eliminado un activo del activo, proyecto o catálogo de importación de metadatos, el activo en cuestión se vuelve a importar a menos que lo haya eliminado del ámbito. Los activos que se han eliminado del ámbito de datos después de la última importación no se pueden volver a importar y tienen el estado Outdated. Los activos que se han suprimido del origen de datos después de la última importación tampoco se pueden volver a importar y tener el estado Removed.

Suprimir un activo de importación de metadatos

Puede suprimir un activo de importación de metadatos de un proyecto. Seleccione la opción Suprimir en el menú de acciones situado junto al activo en la página Activos del proyecto. Se suprimen la configuración de importación de metadatos y su trabajo de importación de metadatos asociado. Los activos del proyecto o un catálogo que se han importado con este activo de importación de metadatos no resultan afectados.

Más información

Próximos pasos

Tema principal: Proceso de datos