0 / 0
Volver a la versión inglesa de la documentación
Guía de aprendizaje de gobierno de datos: Curar datos de alta calidad

Guía de aprendizaje de gobierno de datos: Curar datos de alta calidad

Siga esta guía de aprendizaje para aprender a preparar datos de confianza con el caso de uso de gobierno de datos de la prueba de entramado de datos. Su objetivo es crear activos de datos de confianza enriqueciendo los datos y ejecutando el análisis de calidad de datos.

Inicio rápido: Si todavía no ha creado el proyecto de ejemplo para esta guía de aprendizaje, acceda al Proyecto de ejemplo de gobierno de datos en el concentrador de recursos.

La historia de la guía de aprendizaje corresponde a Golden Bank, que tiene varios departamentos que necesitan acceso a datos de alta calidad sobre hipotecas de cliente. Como encargado de datos en el equipo de gobierno, debe ordenar y organizar los datos de la empresa para proporcionar activos de datos protegidos y de alta calidad que los consumidores de datos pueden encontrar fácilmente en un catálogo de autoservicio.

La siguiente imagen animada proporciona una vista previa rápida de lo que logrará al final de esta guía de aprendizaje, donde importará metadatos de un origen de datos externo, enriquecerá esos datos con términos empresariales asignados automáticamente, verá los datos enriquecidos y publicará los datos enriquecidos en un catálogo. Pulse la imagen para ver una imagen más grande.

Imagen animada

Vista previa de la guía de aprendizaje

En esta guía de aprendizaje, realizará estas tareas:

Ver vídeo Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.





Sugerencias para completar esta guía de aprendizaje

Utilizar la imagen en imagen de vídeo

Sugerencia: Inicie el vídeo y, a continuación, a medida que se desplaza por el tutorial, el vídeo se desplaza al modo de imagen en imagen. Cierre la tabla de contenido de vídeo para obtener la mejor experiencia con la imagen en imagen. Puede utilizar el modo de imagen en imagen para poder seguir el vídeo mientras completa las tareas de este tutorial. Pulse las indicaciones de fecha y hora para cada tarea a seguir.

La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:

Cómo utilizar la imagen en la imagen y los capítulos

Obtener ayuda en la comunidad

Si necesita ayuda con esta guía de aprendizaje, puede formular una pregunta o encontrar una respuesta en el foro de discusión de la comunidad deCloud Pak for Data.

Configurar las ventanas del navegador

Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.

Guía de aprendizaje en paralelo e interfaz de usuario

Sugerencia: Si encuentra una visita guiada al completar esta guía de aprendizaje en la interfaz de usuario, pulse Quizás más tarde.



Configurar los requisitos previos

Registro en Cloud Pak for Data as a Service

Debe registrarse en Cloud Pak for Data as a Service y suministrar los servicios necesarios para el caso de uso de integración de datos.

  • Si tiene una cuenta de Cloud Pak for Data as a Service existente, puede empezar con esta guía de aprendizaje. Si tiene una cuenta de plan Lite, sólo un usuario por cuenta puede ejecutar esta guía de aprendizaje.
  • Si todavía no tiene una cuenta de Cloud Pak for Data as a Service , regístrese para una prueba de entramado de datos.

Icono Vídeo Vea el siguiente vídeo para obtener más información sobre el entramado de datos en Cloud Pak for Data.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.

Verificar los servicios suministrados necesarios

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 01:05.

Siga estos pasos para verificar o suministrar los servicios necesarios:

  1. En el Cloud Pak for Data menú de navegación Menú de navegación, elija Servicios > Instancias de servicio.

  2. Utilice la lista desplegable Producto para determinar si existe una instancia de servicio de IBM Knowledge Catalog .

  3. Si necesita crear una instancia de servicio de IBM Knowledge Catalog , pulse Añadir servicio.

    1. Seleccione IBM Knowledge Catalog.

    2. Seleccione el plan Lite.

    3. Pulse Crear.

  4. Repita estos pasos para verificar o suministrar el servicio Cloud Object Storage .

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra las instancias de servicio suministradas:

Servicio de suministro

Crear el proyecto de ejemplo

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 01:38.

Si todavía no ha creado el proyecto de ejemplo para esta guía de aprendizaje, siga estos pasos:

  1. Acceda al proyecto de ejemplo de gobierno de datos en el concentrador de recursos.

  2. Pulse Crear proyecto.

  3. Si se le solicita que asocie el proyecto a una instancia de Cloud Object Storage, seleccione una instancia de Cloud Object Storage de la lista.

  4. Pulse Crear.

  5. Espere a que finalice la importación del proyecto y, a continuación, pulse Ver proyecto nuevo para verificar que el proyecto y los activos se han creado correctamente.

  6. Pulse el separador Activos para ver los activos del proyecto.

  7. En el menú Menú de desbordamiento Desbordamiento al final de la fila del activo de datos Banking.csv , elija Descargary guárdelo en el sistema. Utilizará ese archivo en un paso posterior.

Nota: Es posible que vea una visita guiada que muestra las guías de aprendizaje que se incluyen con este caso de uso. Los enlaces de la visita guiada abrirán estas instrucciones del tutorial.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el separador Activos en el proyecto de ejemplo. Ahora está preparado para iniciar la guía de aprendizaje.

Proyecto de ejemplo




Tarea 1: Crear un catálogo

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:49.

Antes de empezar a trabajar con datos, cree un catálogo donde publicará los datos para compartirlos con su organización. Con el plan Lite IBM Knowledge Catalog , solo puede crear dos catálogos. Si ya tiene un catálogo, puede omitir este paso. De lo contrario, siga estos pasos para crear un catálogo:

Sugerencia: Si esta ocasión es la primera vez que accede a un catálogo, verá una visita guiada preguntando si desea realizar una visita guiada a los catálogos. Por ahora, pulse Quizás más tarde.
  1. En el menú de navegación Cloud Pak for Data Menú de navegación, elija Catálogos > Ver todos los catálogos.

  2. Si ve un catálogo en la página Catálogos , vaya a Tarea 2: Crear una categoría. De lo contrario, siga estos pasos para crear un catálogo nuevo:

  3. Pulse Crear catálogo.

  4. Para el Nombre, copie y pegue el nombre de catálogo exactamente como se muestra sin espacios iniciales ni finales:

    Mortgage Approval Catalog
    
  5. Seleccione Imponer reglas de protección de datos, confirme la selección y acepte los valores predeterminados para los otros campos.

  6. Pulse Crear.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el catálogo. Ahora está preparado para compartir activos con su organización.

Catálogo de aprobación de hipoteca




Tarea 2: Crear una categoría

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 03:13.

Necesita una categoría para contener los términos empresariales que importará en la siguiente tarea. Las categorías actúan como carpetas para organizar los artefactos de gobernabilidad y las personas que pueden crear y gestionar dichos artefactos. Siga estos pasos para crear una categoría:

  1. En el Cloud Pak for Data menú de navegación Menú de navegación, elija Gobierno > Categorías.

  2. Pulse Añadir categoría > Nueva categoría.

  3. Para el nombre, escriba Banking.

  4. Pulse Crear.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra la categoría Banca. Ahora está preparado para importar términos de negocio.

Categoría bancaria




Tarea 3: Añadir términos de negocio

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 03:41.

Ahora importe los términos de negocio a la nueva categoría. Los utilizará para enriquecer los activos de datos en un paso posterior. Los términos de negocio son definiciones estandarizadas de conceptos de negocio para que los datos se describan de forma uniforme y fácil de comprender en toda la empresa. Siga estos pasos para importar los términos empresariales de un archivo:

  1. En el Cloud Pak for Data menú de navegación Menú de navegación, elija Gobierno > Términos de negocio.

  2. Pulse Añadir término empresarial > Importar desde archivo.

  3. Pulse Arrastrar y soltar archivo aquí o cargar.

    1. Seleccione el archivo banking.csv que ha descargado anteriormente.

    2. Pulse Abrir.

  4. Pulse Siguiente.

  5. Seleccione Sustituir todos los valoresy pulse Siguiente.

  6. Pulse Ir a tarea para ver los términos empresariales de borrador. Si no ha recibido la notificación, en el menú de navegación Cloud Pak for Data Menú de navegación, elija Gobernabilidad > Bandeja de entrada de tareas.

  7. Marque el recuadro de selección Publicar términos empresariales y, a continuación, pulse Publicar. Pulse Publicar para confirmar.

  8. En el menú de navegación de Cloud Pak for Data Menú de navegación, elija Gobierno > Términos de negocio para ver los términos de negocio publicados.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra los términos de negocio importados. Ahora está preparado para importar los datos a un proyecto y, a continuación, enriquecerlos con los términos de negocio importados.

Términos empresariales importados




Tarea 4: Importar datos a un proyecto

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 04:47.

El proyecto de ejemplo incluye una conexión a una instancia de Db2 Warehouse , que contiene los activos de hipoteca. Puede importar metadatos técnicos asociados con los activos de datos en un proyecto o un catálogo para realizar el inventario, evaluar y catalogar estos activos. Los metadatos técnicos describen la estructura de los objetos de datos. Siga estos pasos para importar los activos de datos:

  1. En el menú de navegación Cloud Pak for Data Menú de navegación, seleccione Proyectos > Ver todos los proyectos.

  2. Pulse el proyecto Gobierno de datos .

  3. Pulse la pestaña Activos.

  4. Pulse Nuevo activo.

  5. Seleccione Importación de metadatos para el tipo de activo.

  6. Para el nombre, copie y pegue el texto siguiente:

    Mortgage data - metadata import
    
  7. Pulse Siguiente para continuar.

  8. En la página Seleccionar destino , seleccione Este proyectoy pulse Siguiente para continuar.

  9. En la página Seleccionar ámbito , pulse Seleccionar conexión.

    1. Seleccione la conexión Prueba de entramado de datos - Db2 Warehouse .

    2. Seleccione el recuadro de selección situado junto al esquema WKC_MORTGAGE y, a continuación, pulse el nombre de esquema WKC_MORTGAGE .

    3. Seleccione las tablas siguientes:

      • CLIENTE_COMERCIAL
      • CREDIT_SCORE
      • HOUSE_PRICE
      • MORTGAGE_APPLICANTS
      • MORTGAGE_APPLICATION
    4. Revise la lista de activos en el panel lateral y, a continuación, pulse Seleccionar.

  10. Pulse Siguiente para continuar con la planificación. Puede ejecutar manualmente el enriquecimiento de metadatos, por lo tanto, mantenga la planificación desactivada.

  11. Pulse Siguiente para continuar con las Opciones avanzadas.

  12. Acepte los valores predeterminados en la página Opciones avanzadas y pulse Siguiente para continuar con la revisión.

  13. Revise el resumen de la importación y pulse Crear. Se inicia el trabajo de importación de metadatos.

  14. Pulse el icono Renovar Icono Renovar para ver el cambio de estado de En cola a En curso a Importado. Cuando se complete la ejecución del trabajo, verá los cinco activos listados.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra la importación de metadatos completada. La siguiente tarea es enriquecer los activos de datos importados con los términos empresariales importados.

Activo Metadata import




Tarea 5: Enriquecer los datos importados

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 06:07.

Puede enriquecer los activos de datos con información que ayude a los usuarios a encontrar datos más rápidamente para decidir si los datos son adecuados para la tarea en cuestión, si pueden confiar en los datos y cómo trabajar con los datos. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas. Siga estos pasos para enriquecer los datos importados:

  1. Pulse el nombre del proyecto Gobierno de datos en la pista de navegación.
    Ruta de navegación

  2. En la ficha Activos , pulse Activo nuevo.

  3. Seleccione Enriquecimiento de metadatos para el tipo de activo.

  4. Para el nombre, copie y pegue el texto siguiente:

    Mortgage data - metadata enrichment
    
  5. Pulse Siguiente para continuar.

  6. Pulse Seleccionar datos del proyecto.

    1. Seleccione Metadata import.

    2. Pulse el recuadro de selección situado junto a Datos de hipoteca-importación de metadatos. Este activo incluye los activos siguientes:

      • COMMERICIAL_CLIENT
      • CREDIT_SCORE
      • HOUSE_PRICE
      • MORTGAGE_APPLICANTS
      • MORTGAGE_APPLICATION
    3. Pulse Seleccionar.

  7. Pulse Siguiente para continuar con el objetivo de enriquecimiento.

  8. Seleccione todos los objetivos de enriquecimiento:

    • Datos de perfil
    • Analizar la calidad
    • Asignar términos
  9. Para Categorías, pulse Seleccionar categorías.

    1. Seleccione solo [sin categorizar] y Banca.

    2. Pulse Seleccionar.

  10. Para Muestreo, seleccione Básico.

  11. Pulse Siguiente para continuar con la planificación. Puede ejecutar manualmente la importación, por lo que debe mantener la planificación desactivada.

  12. Pulse Siguiente para continuar con la revisión.

  13. Pulse Crear.

  14. Se muestra el activo de enriquecimiento de metadatos, pero el trabajo puede tardar varios minutos en completarse. Pulse el icono Renovar Icono Renovar para observar el cambio de estado de No analizado a En curso a Finalizado. Cuando se complete la ejecución del trabajo, verá los cinco activos listados.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra el enriquecimiento de metadatos completado. Ahora puede explorar los activos de datos enriquecidos.

Activo de enriquecimiento de metadatos




Tarea 6: Ver los resultados del enriquecimiento de metadatos

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 07:45.

Una vez completada la ejecución del enriquecimiento de metadatos, siga estos pasos para ver los datos enriquecidos:

  1. En la pantalla Enriquecimiento de metadatos de datos de hipoteca , pulse la pestaña Columnas .

  2. En la lista de Columnas, localice la columna EMAIL_ADDRESS para el activo MORTGAGE_SOLICITANTES .

    1. Al final de la fila EMAIL_ADDRESS para HIPOTECAGE_SOLICITANTES , pulse el menú Desbordamiento Menú de desbordamiento y elija Ver detalles de columna.

    2. En el panel lateral de la pestaña Detalles , verá información de perfilado como: Formato, Distribución de frecuencia, Estadísticos.

    3. En el panel lateral, pulse la pestaña Gobierno . Esta pestaña incluye las clases de datos y los términos empresariales que se asignaron automáticamente durante el enriquecimiento de metadatos. También puede ver los términos de negocio sugeridos y las clases de datos, y asignarlos manualmente.

    4. Revise los términos sugeridos y asígnelos manualmente:

      1. Pulse Términos empresariales sugeridos.

      2. Para Dirección, pulse Asignar.

  3. Al final de la columna EMAIL_ADDRESS para la fila de activos HIPOTECAGE_SOLICITANTES , pulse el menú Menú de desbordamiento Desbordamiento y seleccione Ver detalles de calidad de datos.

    1. Ver la información de calidad de datos. IBM Knowledge Catalog genera automáticamente una puntuación de calidad de datos para cada columna y activo de datos analizando cada valor de cada registro según las dimensiones predefinidas.

    2. Pulse la X para cerrar la ventana Calidad de datos .

  4. Para la columna CITY para el activo CREDIT_SCORE , pulse el menú Desbordamiento Menú de desbordamiento y elija Marcar como revisado.

  5. Pulse la pestaña Activos.

  6. En la lista de Activos, para el activo MORTGAGE_SOLICITANTES , pulse el menú Desbordamiento Menú de desbordamiento y seleccione Ver detalles de activo.

    1. En el panel lateral, pulse la pestaña Gobierno para ver la asignación automática de términos de negocio.

    2. Pulse el icono Editar Icono Editar para asignar manualmente términos de negocio.

    3. Busque social. Si no ve ningún resultado, asegúrese de que la lista desplegable esté establecida en Todos los términos en lugar de Términos sugeridos.

    4. Seleccione Número de seguridad social.

    5. Pulse Asignar.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra los activos de datos revisados y enriquecidos. El paso siguiente es publicar los datos enriquecidos en un catálogo para compartirlos con su organización.

Activos de datos enriquecidos revisados




Tarea 7: Publicar datos en un catálogo

vídeo tutorial de vista previa Para obtener una vista previa de esta tarea, vea el vídeo a partir de 09:06.

Ahora que ha enriquecido los datos, desea publicar esos activos de datos en un catálogo para que los científicos de datos y los analistas de datos puedan utilizar los activos de datos enriquecidos. Siga estos pasos para almacenar los activos de datos enriquecidos en un catálogo para que otros tengan acceso a los datos de confianza:

  1. Pulse el nombre del proyecto Gobierno de datos en la pista de navegación.

  2. Pulse la pestaña Activos.

  3. Seleccione Datos > Activos de datos.

  4. Seleccione los activos de datos COMMERICIAL_CLIENT, HOUSE_PRICE, MORTGAGE_SOLICITANTESy MORTGAGE_APPLICATION de la lista y pulse Publicar en catálogo.

    1. Para el catálogo Destino , seleccione Catálogo de aprobación de hipotecay pulse Siguiente.

    2. Para las Etiquetas, escriba la etiqueta, trusted, pulse + (signo más) y, a continuación, pulse Siguiente.

    3. Revise los activos y pulse Publicar.

  5. Borre todos los activos seleccionados y, a continuación, seleccione el recuadro de selección situado junto al activo CREDIT_SCORE de la lista y pulse Publicar en catálogo.

    1. Para el catálogo Destino , seleccione Catálogo de aprobación de hipotecay pulse Siguiente.

    2. Para las Etiquetas, escriba la etiqueta confidentialy pulse + (signo más).

    3. Escriba la etiqueta trustedy pulse + (signo más) en una segunda etiqueta.

    4. Seleccione la opción Ir al catálogo después de publicarloy pulse Siguiente.

    5. Revise los activos y pulse Publicar.

  6. Filtre los activos en el Catálogo de aprobación de hipotecas.

    1. Pulse el icono Filtro Icono de filtro .

    2. Expanda la sección Etiqueta .

    3. Seleccione de confianzay pulse Aplicar.

    4. Verifique que los cinco activos de datos se han añadido al catálogo.

  7. Cambie el nombre del activo de datos HIPOTECAGE_SOLICITANTES .

    1. Abra el activo HIPOTECAGE_SOLICITANTES .

    2. Pulse el icono Editar nombre Icono Editar nombre .

    3. Cambie el nombre por:

      MORTGAGE_APPLICANTS_TRUST
      
    4. Haga clic en Aplicar.

Icono de punto de comprobación Compruebe el progreso

La imagen siguiente muestra los activos de datos enriquecidos publicados en un catálogo. Ahora tiene datos de confianza disponibles a través del catálogo de su empresa.

Activos publicados en el catálogo



Como encargado de datos en el equipo de gobierno, ha aprendido a ordenar y organizar los datos de la empresa para proporcionar activos de datos protegidos y de alta calidad que los consumidores de datos pueden encontrar fácilmente en un catálogo de autoservicio.

Próximos pasos

Ahora está preparado para proteger los datos creando reglas de protección de datos y enmascarando flujos para controlar el acceso a los datos.Consulte la guía de aprendizaje de Proteger sus datos.

Más información

Tema padre: Guías de aprendizaje de casos de uso

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información