Inicio rápido: Ordenar datos

Puede ordenar datos rápidamente importando información para conjuntos de datos seleccionados en un origen de datos y, a continuación, publicar los activos de datos resultantes en un catálogo. Lea acerca de la ordenación de datos y luego vea un video y siga una guía de aprendizaje que sea adecuada para los usuarios con ciertos conocimientos sobre la ordenación de datos, pero que no requiere codificación.

Roles necesarios Debe tener el rol de Administrador o de Editor en un proyecto y el rol de Administrador o de Editor en el catálogo de destino.

El flujo de trabajo básico incluye estas tareas:

  1. Cree un proyecto. Consulte Crear un proyecto.
  2. Cree una conexión con un origen de datos externo. Consulte Adición de conexiones a proyectos.
  3. Cree un activo de importación de metadatos para configurar los detalles de la importación, ejecutar el trabajo de importación y publicar los activos en el catálogo.

Obtener información sobre cómo ordenar datos

Puede importar metadatos técnicos asociados a los activos de datos de su organización a un proyecto o un catálogo para inventariar, evaluar y catalogar estos activos. Estos metadatos ayudan a los usuarios a decidir si los datos son adecuados para la tarea en cuestión, si pueden confiar en los datos y cómo trabajar con ellos.

Los metadatos que se importan pueden enriquecerse posteriormente con otra información para ayudar a los usuarios a encontrar los datos más rápidamente y utilizarlos con confianza. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas.

Al importar metadatos, añade activos de datos a un proyecto o a un catálogo. Si importa los activos a un proyecto, no son visibles en ningún catálogo hasta que los publique. Después de compartirlos en un catálogo, otros usuarios de catálogo pueden trabajar con estos activos.

Obtener más información sobre la importación de metadatos

Ver un vídeo sobre la importación de metadatos de activos

Ver vídeo Vea este vídeo para ver cómo importar metadatos de activos desde un origen de datos externo.

Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.

Pruebe una guía de aprendizaje para importar metadatos de activos

Cree un activo de importación de metadatos en un proyecto existente, ejecute un trabajo y, a continuación, añada activos de selección a un catálogo.

Requisitos previos

  1. Un catálogo creado previamente o acceso a crear un catálogo.
  2. Credenciales para la instancia de Cloud Object Storage.

    1. En el menú Cloud Pak for Data, pulse Servicios > Instancias de servicio.
    2. Pulse el icono situado junto a la instancia de Cloud Object Storage y, si es necesario, inicie sesión en IBM Cloud.
    3. En la página de la instancia de servicio de Cloud Object Storage, seleccione el panel Credenciales de servicio para ver sus credenciales. Si tiene más de un conjunto de credenciales listadas, seleccione credenciales que incluyan cos_hmac_keys. Deberá proporcionar estas credenciales más adelante en esta guía de aprendizaje.
    4. Seleccione el panel Puntos finales.
    5. Seleccione su ubicación, por ejemplo, us-geo.
    6. Copie el URL de inicio de sesión público, por ejemplo, https://s3.us.cloud-object-storage.appdomain.cloud.
  3. Un proyecto de ejemplo con conjuntos de datos cargados en la instancia de Cloud Object Storage.

    1. Acceda al Proyecto de optimización de precios de seguros.
    2. Pulse Crear proyecto.
    3. El nombre, la descripción y el almacenamiento se rellenarán automáticamente. Pulse Crear.
    4. Pulse Ver resumen de importación. Los archivos de datos de la pestaña Activos del proyecto se han añadido a la instancia de Cloud Object Storage.

En esta guía de aprendizaje, hará lo siguiente:

  • Cree un proyecto.
  • Importe metadatos a un proyecto.
  • Vea los resultados de la importación y publicación de activos en el catálogo.

Le llevará aproximadamente 20 minutos el completar esta guía de aprendizaje.

Paso 1: Crear un proyecto

{: #step1}Necesita un proyecto para almacenar el activo de metadatos de importación y los activos descubiertos.

  1. Si tiene un proyecto existente que no sea el proyecto de ejemplo que ha creado como requisito previo, abra este proyecto. Si no tiene otro proyecto existente, pulse Crear un proyecto en la página de inicio o pulse Nuevo proyecto en la página Proyectos.
  2. Seleccione Crear un proyecto vacío.
  3. En la pantalla Crear un proyecto, añada un nombre y una descripción opcional para el proyecto.
  4. Seleccione uno existente o cree uno nuevo.
  5. Pulse Crear.

Para obtener más información o ver un vídeo, consulte Creación de un proyecto.
Para obtener más información sobre Cloud Object Storage, consulte Almacenamiento de objetos.

Paso 2: Importar metadatos a un proyecto

{: #step2}Cree el activo de importación de metadatos y especifique la conexión para la importación.

  1. En el proyecto, pulse Añadir a un proyecto > Importación de metadatos.
  2. Proporcione un nombre para su importación. La descripción es optativa.
  3. En el desplegable Conexión, seleccione Crear una nueva conexión.
  4. Puede importar metadatos desde los orígenes de datos listados. Para esta guía de aprendizaje, seleccione Cloud Object Storage y pulse Seleccionar.
  5. Proporcione un nombre, una descripción y los detalles de conexión utilizando las credenciales de la instancia de Cloud Object Storage que se encuentra en IBM Cloud.
  6. Pulse Crear para crear la conexión. Esta nueva conexión se mostrará en el recuadro desplegable Definir conexión de origen y destino.
  7. Puede optar por importar metadatos a un proyecto o a un catálogo. En esta guía de aprendizaje, primero importará los metadatos al proyecto, y seleccionará los activos específicos para publicarlos en un catálogo.
  8. Pulse Siguiente para continuar con el ámbito de datos.

Paso 3: Definir un ámbito de datos

{: #step3}Defina los activos que se deben importar desde la conexión.

  1. Pulse Establecer ámbito de datos.
  2. Puede seleccionar todos los esquemas o simplemente seleccionar esquemas o tablas para importar. Si selecciona la carpeta insurancepricingoptimization, podrá ver el número de elementos que contiene.
  3. Marque el recuadro de selección situado junto a la carpeta insurancepricingoptimization para definir el ámbito como todos los activos de dicha carpeta.
  4. Pulse Seleccionar para seguir definiendo el activo de importación de metadatos.
  5. Pulse Siguiente para continuar con la planificación.

Paso 4: Planificar y completar la importación

{: #step4}Especifique si desea ejecutar la importación ahora o planificarla para una fecha posterior.

  1. (Opcional) Modifique el nombre de trabajo predeterminado.
  2. (Opcional) Seleccione el conmutador Desactivar planificación para especificar los detalles de inicio y de repetición.
  3. Pulse Siguiente para continuar con la revisión.
  4. Revise el resumen de la importación y pulse Crear.
  5. El trabajo de importación de metadatos se iniciará o se ejecutará a la hora planificada.

{: #step5}Cuando se haya completado la ejecución del trabajo, se mostrará la lista de activos importados.

  1. Seleccione uno o varios archivos csv de la lista y pulse Publicar.
  2. Seleccione el catálogo de destino, proporcione una descripción y etiquetas y luego pulse Publicar.
  3. Vaya al catálogo para ver los activos de datos que acaba de añadir en la pestaña Añadido recientemente.

Próximos pasos

Ahora los datos están listos para ser utilizados. Por ejemplo, usted u otros usuarios pueden realizar cualquiera de estas tareas:

Recursos

adicionales

Tema principal: Iniciación a la ordenación y al gobierno de datos