0 / 0
Volver a la versión inglesa de la documentación
Guía de aprendizaje de gobierno de datos: gobierno de datos virtualizados
Última actualización: 28 nov 2024
Guía de aprendizaje de gobierno de datos: gobierno de datos virtualizados

Realice este tutorial para gobernar los datos que se virtualizaron después de completar el tutorial Curar datos de alta calidad, el tutorial Proteger sus datos y el tutorial Virtualizar datos externos con el caso de uso de integración de datos de la prueba de tejido de datos. Su objetivo es proteger los datos virtuales que contienen los solicitantes de hipotecas y las solicitudes y sus puntuaciones de crédito para el acceso no autorizado. Cierta información personal como el número de seguridad social, debe estar enmascarada para que todos los empleados de Golden Bank no tengan acceso a esa información personal.

Inicio rápido: Si todavía no ha creado el proyecto de ejemplo para esta guía de aprendizaje, acceda al Proyecto de ejemplo de gobierno de datos en el concentrador de recursos.

La historia de la guía de aprendizaje es que Golden Bank tiene varios departamentos que necesitan acceso a datos de hipoteca de cliente de alta calidad que se almacenan en tres orígenes de datos externos. Como encargado de datos en el equipo de gobierno, debe enriquecer los datos virtualizados y asegurarse de que los datos virtualizados están protegidos.

La siguiente imagen animada proporciona una vista previa rápida de lo que logrará al final de este tutorial. Añadirá datos virtuales al proyecto y, a continuación, los enriquecerá con términos empresariales y verá cómo las reglas de protección de datos de IBM Knowledge Catalog enmascaran los datos a través de Cloud Pak for Data as a Service. Pulse la imagen para ver una imagen más grande.

Imagen animada

Vista previa de la guía de aprendizaje

En esta guía de aprendizaje, realizará estas tareas:

Ver vídeo Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.

Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.





Sugerencias para completar esta guía de aprendizaje
Estas son algunas sugerencias para completar correctamente esta guía de aprendizaje.

Utilizar la imagen en imagen de vídeo

Sugerencia: Inicie el vídeo y, a continuación, a medida que se desplaza por el tutorial, el vídeo se desplaza al modo de imagen en imagen. Cierre la tabla de contenido de vídeo para obtener la mejor experiencia con la imagen en imagen. Puede utilizar el modo de imagen en imagen para poder seguir el vídeo mientras completa las tareas de este tutorial. Pulse las indicaciones de fecha y hora para cada tarea a seguir.

La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:

Cómo utilizar la imagen en la imagen y los capítulos

Obtener ayuda en la comunidad

Si necesita ayuda con este tutorial, puede hacer una pregunta o encontrar una respuesta en el foro de debate de la Comunidad deCloud Pak for Data.

Configurar las ventanas del navegador

Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.

Guía de aprendizaje en paralelo e interfaz de usuario

Sugerencia: Si encuentra una visita guiada al completar esta guía de aprendizaje en la interfaz de usuario, pulse Quizás más tarde.



Configurar los requisitos previos

Complete las guías de aprendizaje de requisito previo

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo que comienza en 00:27.

Complete las guías de aprendizaje siguientes:

  • Guía de aprendizaje Virtualizar datos externos para crear tablas virtuales y unir vistas a partir de datos almacenados en tres orígenes externos.
  • Guía de aprendizaje Curar datos de alta calidad para importar y enriquecer activos de datos y publicarlos en un catálogo.
  • Guía de aprendizaje Proteger los datos para crear reglas de protección de datos para proteger los datos.

Base Premium Standard A menos que se indique lo contrario, esta información se aplica a todas las ediciones de IBM Knowledge Catalog.




Tarea 1: Habilitar el gobierno de datos virtualizados

Hay dos pasos necesarios para habilitar el gobierno de datos virtualizados:

  • Aplique las normas de protección de datos en la Data Virtualization.
  • Configure la autorización entre IBM Knowledge Catalog y Data Virtualization.

Aplicar reglas de protección de datos

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo que comienza en 01:02.

Siga estos pasos para aplicar reglas de protección de datos en Data Virtualization:

  1. En el menú de navegación ' Menú de navegación, seleccione Datos > Data virtualization.

  2. Si ve una notificación para Configurar un catálogo primario para aplicar el gobierno, pulse Ir al gobierno. Si no ve este mensaje, en el menú del servicio, haga clic en Administración > Configuración del servicio y, a continuación, en la pestaña Gobierno.
    Menú Servicio de Data Virtualization

  3. Habilite la opción Imponer reglas de protección de datos para objetos virtuales y pulse Guardar.

  4. En el menú de servicio, vuelva a Virtualización > Orígenes de datos.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra el separador Gobierno con la imposición de políticas habilitada. A continuación, debe configurar la autorización entre IBM Knowledge Catalog y Data Virtualization.

Aplicar políticas

Configurar la autorización entre IBM Knowledge Catalog y Data Virtualization

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo que comienza en 01:40.

Siga estos pasos para configurar la autorización entre IBM Knowledge Catalog y Data Virtualization:

  1. Visite la página Autorizaciones en la consola IBM Cloud.

  2. Pulse Crear.

  3. Para ¿En qué cuenta está el servicio? seleccione Esta cuenta.

  4. Para ¿Qué servicio o servicios necesitan acceso? seleccione IBM Knowledge Catalog.

  5. Para ¿Cómo desea limitar el acceso? en IBM Knowledge Catalog, seleccione Todos los recursos.

  6. Para ¿A qué desea dar acceso al origen? seleccione Data Virtualization.

  7. Para ¿Cómo desea limitar el acceso? a Data Virtualization, seleccione Todos los recursos.

  8. Para Acceso de servicio, seleccione DataAccess (For Service to Service Authorization Only).

  9. Pulse Autorizar.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra la página Autorizaciones en IBM Cloud con la autorización entre IBM Knowledge Catalog y Data Virtualization. Ahora está preparado para consultar tablas virtuales gobernadas en Data Virtualization.

Página Autorizaciones




Tarea 2: Ejecutar una consulta SQL en tablas virtuales gobernadas

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo que comienza en 02:20.

Con las reglas de protección de datos en vigor, las tablas virtuales se rigen por dichas reglas. Siga estos pasos para ejecutar una consulta SQL en una tabla virtual gobernada:

  1. En el menú del servicio Data Virtualization, haga clic en Ejecutar SQL.
    Menú Servicio de Data Virtualization

  2. Copie y pegue la siguiente sentencia SELECT para la nueva consulta. Sustituya <your schema> por el nombre de esquema que ha anotado anteriormente.

    SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    

    Su consulta es similar a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
    ' Sentencia Select

  3. Pulse Ejecutar todo.

  4. Una vez completada la consulta, seleccione la consulta en el separador Historial . En la pestaña Resultados , puede ver que la tabla sólo se filtra a los candidatos del estado de California. Las reglas de protección de datos se aplican en la Data Virtualization, la vista previa de catálogos, la descarga de catálogos, la Data Refinery y la vista previa de Activos de proyecto. La regla no se aplica al propietario del activo. Ver vídeo ' Mira el video en 02:47 para ver lo que otros usuarios ven cuando ejecutan la consulta SQL.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra los resultados de la consulta SQL desde la perspectiva de otro usuario. Ahora está preparado para copiar las tablas virtuales en el proyecto.

Resultados de consulta SQL




Tarea 3: Copiar los datos virtuales en el proyecto

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo que comienza en 03:02.

En la guía de aprendizaje Virtualizar datos externos , ha creado tablas virtuales y vistas de unión virtual y las ha copiado en el proyecto de integración de datos. Si desea utilizar ese proyecto para completar esta guía de aprendizaje, vaya a la Tarea 3. Si desea utilizar el proyecto de gobierno de datos para completar esta guía de aprendizaje, siga estos pasos:

  1. En el menú de servicios, haga clic en Virtualización > Datos virtualizados.
    Menú Servicio de Data Virtualization

  2. Seleccione las tablas siguientes:

    • MORTGAGE_APPLICATION
    • SOLICITANTE de hipoteca
    • CREDIT_SCORE
    • APLICACIONES_APLICACIONES_UNIDAS
    • APLICACIONES_APLICACIONES_CREDIT_SCORE_UNIDAS
  3. Pulse Asignar.

  4. Para el Proyecto, seleccione Gobierno de datos.

  5. Pulse Asignar.

  6. Cuando los objetos virtuales se hayan asignado correctamente, vaya al proyecto.

  7. En el proyecto Gobierno de datos , pulse el separador Activos . Las tablas de datos virtuales empiezan por <your schema>.

  8. Abra cualquiera de las tablas de datos virtuales. Por ejemplo, pulse la tabla virtual APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNI para verla.

  9. Proporcione sus credenciales para acceder al activo de datos.

    1. Para el Método de autenticación, seleccione Clave de API.

    2. Pega la misma clave API que creaste en el tutorial Virtualizar datos externos. Pegar clave de API

    3. Pulse Conectar. Las reglas de protección de datos se aplican en la vista previa del catálogo, la descarga del catálogo, Data Refineryy la vista previa de Activo de proyecto. La regla no se aplica al propietario del activo. Ver vídeo ' Mira el video en 04:09 para ver lo que otros usuarios ven tratando de acceder a la tabla de datos virtual.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra la tabla virtual con una columna enmascarada en el proyecto desde la perspectiva de un usuario diferente. Ahora está preparado para enriquecer los datos.

Tabla virtual en proyecto




Tarea 4: Enriquecer las tablas de datos virtuales

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo a partir del minuto 04:21.

Puede enriquecer los activos de datos con información que ayude a los usuarios a encontrar datos más rápidamente. Los usuarios pueden utilizar los enriquecimientos para decidir si los datos son adecuados para la tarea en cuestión, si pueden confiar en los datos y cómo trabajar con los datos. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas. Siga estos pasos para enriquecer las tablas de datos virtuales:

  1. Haga clic en Gobierno de datos en la ruta de navegación para volver al proyecto.
    Ruta de navegación

  2. Sobre el Activos pestaña, haga clic Nuevo activo > Enriquecer activos de datos con metadatos .

  3. Para el nombre, copie y pegue el texto siguiente:

    Virtual mortgage data - metadata enrichment
    
  4. Pulse Siguiente para continuar.

  5. Pulse Seleccionar datos del proyecto.

    1. Seleccione Activo de datos.

    2. Pulse el recuadro de selección situado junto a los activos siguientes:

      • <your schema>.MORTGAGE_APPLICATION
      • <your schema>.MORTGAGE_APPLICANT
      • <your schema>.CREDIT_SCORE
      • <your schema>.APPLICANTS_APPLICATIONS_JOINED
      • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
    3. Pulse Seleccionar.

  6. Pulse Siguiente para continuar con el objetivo de enriquecimiento.

  7. Seleccione todos los objetivos de enriquecimiento:

    • Datos de perfil
    • Asignar términos
    • Ejecutar análisis de calidad básico
  8. Para Categorías, pulse Seleccionar categorías.

    1. Seleccione solo [sin categorizar] y Banca.

    2. Pulse Seleccionar.

  9. Para Muestreo, seleccione Básico.

  10. Pulse Siguiente para continuar con la planificación.

  11. Pulse Siguiente para continuar con la revisión.

  12. Pulse Crear.

  13. Se muestra el activo de enriquecimiento de metadatos, pero el trabajo puede tardar varios minutos en completarse. Haga clic en el icono Actualizar ' Renovar para ver cómo cambia el estado de En cola a En curso y a Finalizado. Cuando se complete la ejecución del trabajo, verá los cinco activos listados.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra el enriquecimiento de metadatos completado. Ahora puede explorar los activos de datos enriquecidos.

Datos enriquecidos




Tarea 5: Ver los resultados del enriquecimiento de metadatos

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo a partir del minuto 05:48.

Una vez completada la ejecución del enriquecimiento de metadatos, siga estos pasos para ver los datos enriquecidos:

  1. En la pantalla Enriquecimiento de metadatos de datos de hipoteca virtual , pulse la pestaña Columnas .

  2. Busque mortgage_applicant.

  3. En la lista de Columnas, localice la columna EMAIL_ADDRESS para el activo your-schema.MORTGAGE_APPLICANT .

    1. Haga clic en el menú Desbordamiento ' Menú de desbordamiento al final de la fila EMAIL_ADDRESS de your_schema.MORTGAGE_APPLICANT y seleccione Ver detalles de columna.

    2. En el panel lateral de la pestaña Detalles , verá información de perfilado como: Formato, Distribución de frecuencia, Estadísticos.

    3. En el panel lateral, pulse la pestaña Gobierno . Esta pestaña incluye las clases de datos y los términos empresariales que se asignaron automáticamente durante el enriquecimiento de metadatos. También puede ver los términos de negocio sugeridos y las clases de datos, y asignarlos manualmente.

    4. Revise los términos de negocio sugeridos o las clases de datos y asígnelos manualmente. Por ejemplo, puede ver Dirección como un término empresarial sugerido.

      1. Pulse Términos empresariales sugeridos.

      2. Para Dirección, pulse Asignar.

      3. Pulse Clases de datos sugeridas.

      4. Para Texto, pulse Asignar.

  4. Al final de la columna EMAIL_ADDRESS de su fila de activos your_schema.MORTGAGE_APPLICANT, haga clic en el menú de desbordamiento ' Menú de desbordamiento, y seleccione Ver detalles de calidad de datos.

    1. Ver la puntuación de calidad de datos. IBM Knowledge Catalog genera automáticamente una puntuación de calidad de datos para cada columna y activo de datos analizando cada valor de cada registro según las dimensiones predefinidas.

    2. Pulse la X para cerrar la ventana Calidad de datos .

  5. Busque credit_score.

  6. Para la columna CITY del activo your_schema.CREDIT_SCORE, haga clic en el menú Desbordamiento ' Menú de desbordamiento, y seleccione Marcar como revisado.

  7. Pulse la pestaña Activos.

  8. En la lista de Activos, para su activo your_schema.MORTGAGE_APPLICANT, haga clic en el menú Desbordamiento ' Menú de desbordamiento, y seleccione Ver detalles del activo.

    1. En el panel lateral, pulse la pestaña Gobierno para ver cualquier término empresarial que se haya asignado automáticamente.

    2. Haga clic en el icono Añadir ' Añadir (o puede ver el icono Editar ' Editar) para asignar manualmente los términos comerciales.

    3. Busque social. Si no ve ningún resultado, asegúrese de que la lista desplegable esté establecida en Todos los términos en lugar de Términos sugeridos.

    4. Seleccione Número de seguridad social.

    5. Pulse Asignar.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra los activos de datos revisados y enriquecidos. El paso siguiente es publicar los datos enriquecidos en un catálogo para compartirlos con su organización.

Activos de datos enriquecidos revisados




Tarea 6: Publicar tablas virtuales en un catálogo

vídeo tutorial de vista previa ' Para previsualizar esta tarea, vea el vídeo a partir del minuto 7:18.

Ahora que los datos virtualizados se han enriquecido con términos empresariales, siga estos pasos para publicar las tablas virtuales en un catálogo:

  1. Haga clic en Gobierno de datos en la ruta de navegación para volver al proyecto.
    Ruta de navegación

  2. Pulse la pestaña Activos.

  3. Vaya a Datos > Activos de datos.

  4. Pulse el recuadro de selección situado junto a los activos siguientes:

    • <your schema>.MORTGAGE_APPLICATION
    • <your schema>.MORTGAGE_APPLICANT
    • <your schema>.CREDIT_SCORE
    • <your schema>.APPLICANTS_APPLICATIONS_JOINED
    • <your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
  5. Pulse Publicar en catálogo.

    1. Seleccione el Catálogo de aprobación de hipoteca (o su nombre de catálogo) en la lista y pulse Siguiente.

    2. Seleccione la opción Ir al catálogo después de publicarloy pulse Siguiente.

    3. Revise los activos y pulse Publicar.

  6. En el Catálogo de aprobación de hipotecas, busque <your-schema>.

  7. Abra una de las tablas virtuales. Si se le solicita, proporcione sus credenciales:

    1. Para el Método de autenticación, seleccione Clave de API.

    2. Pegue la misma clave de API que ha creado en la guía de aprendizaje Virtualizar datos externos .

  8. Pulse el separador Activo para ver los datos. Las reglas de protección de datos se aplican en la vista previa del catálogo, la descarga del catálogo, Data Refineryy la vista previa de Activo de proyecto. La regla no se aplica al propietario del activo. Ver vídeo ' Mira el video en 08:17 para ver lo que otros usuarios ven tratando de acceder a la tabla de datos virtual en el catálogo.

Icono de punto de comprobación ' Comprueba tu progreso

La imagen siguiente muestra la vista previa de datos de la tabla virtual en el catálogo desde la perspectiva del usuario.

Vista previa de catálogo



Como ingenieros de datos y encargados de datos en Golden Bank, ha enriquecido los datos virtualizados para asegurarse de que los datos virtualizados están protegidos.

Limpieza (opcional)

Si desea volver a tomar las guías de aprendizaje en el caso de uso de gobierno de datos, consulte la sección Limpieza en cada una de las guías de aprendizaje de requisito previo:


Próximos pasos

Más información

Tema padre: Guías de aprendizaje de casos de uso

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información