Realice este tutorial para gobernar los datos que se virtualizaron después de completar el tutorial Curar datos de alta calidad, el tutorial Proteger sus datos y el tutorial Virtualizar datos externos con el caso de uso de integración de datos de la prueba de tejido de datos. Su objetivo es proteger los datos virtuales que contienen los solicitantes de hipotecas y las solicitudes y sus puntuaciones de crédito para el acceso no autorizado. Cierta información personal como el número de seguridad social, debe estar enmascarada para que todos los empleados de Golden Bank no tengan acceso a esa información personal.
La historia de la guía de aprendizaje es que Golden Bank tiene varios departamentos que necesitan acceso a datos de hipoteca de cliente de alta calidad que se almacenan en tres orígenes de datos externos. Como encargado de datos en el equipo de gobierno, debe enriquecer los datos virtualizados y asegurarse de que los datos virtualizados están protegidos.
La siguiente imagen animada proporciona una vista previa rápida de lo que logrará al final de este tutorial. Añadirá datos virtuales al proyecto y, a continuación, los enriquecerá con términos empresariales y verá cómo las reglas de protección de datos de IBM Knowledge Catalog enmascaran los datos a través de Cloud Pak for Data as a Service. Pulse la imagen para ver una imagen más grande.
Vista previa de la guía de aprendizaje
En esta guía de aprendizaje, realizará estas tareas:
- Configure los requisitos previos.
- Tarea 1: Habilitar el gobierno de datos virtualizados.
- Tarea 2: Ejecutar una consulta SQL en tablas virtuales.
- Tarea 3: Copiar datos virtualizados en el proyecto.
- Tarea 4: Enriquecer datos virtualizados.
- Tarea 5: Ver los resultados del enriquecimiento de metadatos.
- Tarea 6: Publicar tablas virtuales en un catálogo.
- Limpiar
Vea este vídeo para obtener una vista preliminar de los pasos de esta guía de aprendizaje. Puede haber pequeñas diferencias en la interfaz de usuario que se muestra en el vídeo. El vídeo está pensado para ser un compañero del tutorial escrito.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Sugerencias para completar esta guía de aprendizaje
Estas son algunas sugerencias para completar correctamente esta guía de aprendizaje.
Utilizar la imagen en imagen de vídeo
La siguiente imagen animada muestra cómo utilizar las características de imagen en imagen y tabla de contenido de vídeo:
Obtener ayuda en la comunidad
Si necesita ayuda con este tutorial, puede hacer una pregunta o encontrar una respuesta en el foro de debate de la Comunidad deCloud Pak for Data.
Configurar las ventanas del navegador
Para obtener la experiencia óptima al completar esta guía de aprendizaje, abra Cloud Pak for Data en una ventana de navegador y mantenga abierta esta página de la guía de aprendizaje en otra ventana de navegador para conmutar fácilmente entre las dos aplicaciones. Considere la posibilidad de organizar las dos ventanas del navegador una al lado de la otra para que sea más fácil de seguir.
Configurar los requisitos previos
Complete las guías de aprendizaje de requisito previo
' Para previsualizar esta tarea, vea el vídeo que comienza en 00:27.
Complete las guías de aprendizaje siguientes:
- Guía de aprendizaje Virtualizar datos externos para crear tablas virtuales y unir vistas a partir de datos almacenados en tres orígenes externos.
- Guía de aprendizaje Curar datos de alta calidad para importar y enriquecer activos de datos y publicarlos en un catálogo.
- Guía de aprendizaje Proteger los datos para crear reglas de protección de datos para proteger los datos.
Base Premium Standard A menos que se indique lo contrario, esta información se aplica a todas las ediciones de IBM Knowledge Catalog.
Tarea 1: Habilitar el gobierno de datos virtualizados
Hay dos pasos necesarios para habilitar el gobierno de datos virtualizados:
- Aplique las normas de protección de datos en la Data Virtualization.
- Configure la autorización entre IBM Knowledge Catalog y Data Virtualization.
Aplicar reglas de protección de datos
' Para previsualizar esta tarea, vea el vídeo que comienza en 01:02.
Siga estos pasos para aplicar reglas de protección de datos en Data Virtualization:
En el menú de navegación ' , seleccione Datos > Data virtualization.
Si ve una notificación para Configurar un catálogo primario para aplicar el gobierno, pulse Ir al gobierno. Si no ve este mensaje, en el menú del servicio, haga clic en Administración > Configuración del servicio y, a continuación, en la pestaña Gobierno.
Habilite la opción Imponer reglas de protección de datos para objetos virtuales y pulse Guardar.
En el menú de servicio, vuelva a Virtualización > Orígenes de datos.
' Comprueba tu progreso
La imagen siguiente muestra el separador Gobierno con la imposición de políticas habilitada. A continuación, debe configurar la autorización entre IBM Knowledge Catalog y Data Virtualization.
' Comprueba tu progreso
La imagen siguiente muestra la página Autorizaciones en IBM Cloud con la autorización entre IBM Knowledge Catalog y Data Virtualization. Ahora está preparado para consultar tablas virtuales gobernadas en Data Virtualization.
Tarea 2: Ejecutar una consulta SQL en tablas virtuales gobernadas
' Para previsualizar esta tarea, vea el vídeo que comienza en 02:20.
Con las reglas de protección de datos en vigor, las tablas virtuales se rigen por dichas reglas. Siga estos pasos para ejecutar una consulta SQL en una tabla virtual gobernada:
En el menú del servicio Data Virtualization, haga clic en Ejecutar SQL.
Copie y pegue la siguiente sentencia SELECT para la nueva consulta. Sustituya
<your schema>
por el nombre de esquema que ha anotado anteriormente.SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
Su consulta es similar a SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
'Pulse Ejecutar todo.
Una vez completada la consulta, seleccione la consulta en el separador Historial . En la pestaña Resultados , puede ver que la tabla sólo se filtra a los candidatos del estado de California. Las reglas de protección de datos se aplican en la Data Virtualization, la vista previa de catálogos, la descarga de catálogos, la Data Refinery y la vista previa de Activos de proyecto. La regla no se aplica al propietario del activo. ' Mira el video en 02:47 para ver lo que otros usuarios ven cuando ejecutan la consulta SQL.
' Comprueba tu progreso
La imagen siguiente muestra los resultados de la consulta SQL desde la perspectiva de otro usuario. Ahora está preparado para copiar las tablas virtuales en el proyecto.
Tarea 3: Copiar los datos virtuales en el proyecto
' Para previsualizar esta tarea, vea el vídeo que comienza en 03:02.
En la guía de aprendizaje Virtualizar datos externos , ha creado tablas virtuales y vistas de unión virtual y las ha copiado en el proyecto de integración de datos. Si desea utilizar ese proyecto para completar esta guía de aprendizaje, vaya a la Tarea 3. Si desea utilizar el proyecto de gobierno de datos para completar esta guía de aprendizaje, siga estos pasos:
En el menú de servicios, haga clic en Virtualización > Datos virtualizados.
Seleccione las tablas siguientes:
- MORTGAGE_APPLICATION
- SOLICITANTE de hipoteca
- CREDIT_SCORE
- APLICACIONES_APLICACIONES_UNIDAS
- APLICACIONES_APLICACIONES_CREDIT_SCORE_UNIDAS
Pulse Asignar.
Para el Proyecto, seleccione Gobierno de datos.
Pulse Asignar.
Cuando los objetos virtuales se hayan asignado correctamente, vaya al proyecto.
En el proyecto Gobierno de datos , pulse el separador Activos . Las tablas de datos virtuales empiezan por
<your schema>
.Abra cualquiera de las tablas de datos virtuales. Por ejemplo, pulse la tabla virtual APPLICANTS_APPLICATIONS_CREDIT_SCORE_UNI para verla.
Proporcione sus credenciales para acceder al activo de datos.
Para el Método de autenticación, seleccione Clave de API.
Pega la misma clave API que creaste en el tutorial Virtualizar datos externos.
Pulse Conectar. Las reglas de protección de datos se aplican en la vista previa del catálogo, la descarga del catálogo, Data Refineryy la vista previa de Activo de proyecto. La regla no se aplica al propietario del activo. ' Mira el video en 04:09 para ver lo que otros usuarios ven tratando de acceder a la tabla de datos virtual.
' Comprueba tu progreso
La imagen siguiente muestra la tabla virtual con una columna enmascarada en el proyecto desde la perspectiva de un usuario diferente. Ahora está preparado para enriquecer los datos.
Tarea 4: Enriquecer las tablas de datos virtuales
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 04:21.
Puede enriquecer los activos de datos con información que ayude a los usuarios a encontrar datos más rápidamente. Los usuarios pueden utilizar los enriquecimientos para decidir si los datos son adecuados para la tarea en cuestión, si pueden confiar en los datos y cómo trabajar con los datos. Esta información incluye, por ejemplo, términos que definen el significado de los datos, reglas que documentan la propiedad o determinan estándares de calidad, o reseñas. Siga estos pasos para enriquecer las tablas de datos virtuales:
Haga clic en Gobierno de datos en la ruta de navegación para volver al proyecto.
Sobre el Activos pestaña, haga clic Nuevo activo > Enriquecer activos de datos con metadatos .
Para el nombre, copie y pegue el texto siguiente:
Virtual mortgage data - metadata enrichment
Pulse Siguiente para continuar.
Pulse Seleccionar datos del proyecto.
Seleccione Activo de datos.
Pulse el recuadro de selección situado junto a los activos siguientes:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Pulse Seleccionar.
Pulse Siguiente para continuar con el objetivo de enriquecimiento.
Seleccione todos los objetivos de enriquecimiento:
- Datos de perfil
- Asignar términos
- Ejecutar análisis de calidad básico
Para Categorías, pulse Seleccionar categorías.
Seleccione solo [sin categorizar] y Banca.
Pulse Seleccionar.
Para Muestreo, seleccione Básico.
Pulse Siguiente para continuar con la planificación.
Pulse Siguiente para continuar con la revisión.
Pulse Crear.
Se muestra el activo de enriquecimiento de metadatos, pero el trabajo puede tardar varios minutos en completarse. Haga clic en el icono Actualizar ' para ver cómo cambia el estado de En cola a En curso y a Finalizado. Cuando se complete la ejecución del trabajo, verá los cinco activos listados.
' Comprueba tu progreso
La imagen siguiente muestra el enriquecimiento de metadatos completado. Ahora puede explorar los activos de datos enriquecidos.
Tarea 5: Ver los resultados del enriquecimiento de metadatos
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 05:48.
Una vez completada la ejecución del enriquecimiento de metadatos, siga estos pasos para ver los datos enriquecidos:
En la pantalla Enriquecimiento de metadatos de datos de hipoteca virtual , pulse la pestaña Columnas .
Busque
mortgage_applicant
.En la lista de Columnas, localice la columna EMAIL_ADDRESS para el activo your-schema.MORTGAGE_APPLICANT .
Haga clic en el menú Desbordamiento ' al final de la fila EMAIL_ADDRESS de your_schema.MORTGAGE_APPLICANT y seleccione Ver detalles de columna.
En el panel lateral de la pestaña Detalles , verá información de perfilado como: Formato, Distribución de frecuencia, Estadísticos.
En el panel lateral, pulse la pestaña Gobierno . Esta pestaña incluye las clases de datos y los términos empresariales que se asignaron automáticamente durante el enriquecimiento de metadatos. También puede ver los términos de negocio sugeridos y las clases de datos, y asignarlos manualmente.
Revise los términos de negocio sugeridos o las clases de datos y asígnelos manualmente. Por ejemplo, puede ver Dirección como un término empresarial sugerido.
Pulse Términos empresariales sugeridos.
Para Dirección, pulse Asignar.
Pulse Clases de datos sugeridas.
Para Texto, pulse Asignar.
Al final de la columna EMAIL_ADDRESS de su fila de activos your_schema.MORTGAGE_APPLICANT, haga clic en el menú de desbordamiento ' , y seleccione Ver detalles de calidad de datos.
Ver la puntuación de calidad de datos. IBM Knowledge Catalog genera automáticamente una puntuación de calidad de datos para cada columna y activo de datos analizando cada valor de cada registro según las dimensiones predefinidas.
Pulse la X para cerrar la ventana Calidad de datos .
Busque
credit_score
.Para la columna CITY del activo your_schema.CREDIT_SCORE, haga clic en el menú Desbordamiento ' , y seleccione Marcar como revisado.
Pulse la pestaña Activos.
En la lista de Activos, para su activo your_schema.MORTGAGE_APPLICANT, haga clic en el menú Desbordamiento ' , y seleccione Ver detalles del activo.
En el panel lateral, pulse la pestaña Gobierno para ver cualquier término empresarial que se haya asignado automáticamente.
Haga clic en el icono Añadir ' (o puede ver el icono Editar ' ) para asignar manualmente los términos comerciales.
Busque
social
. Si no ve ningún resultado, asegúrese de que la lista desplegable esté establecida en Todos los términos en lugar de Términos sugeridos.Seleccione Número de seguridad social.
Pulse Asignar.
' Comprueba tu progreso
La imagen siguiente muestra los activos de datos revisados y enriquecidos. El paso siguiente es publicar los datos enriquecidos en un catálogo para compartirlos con su organización.
Tarea 6: Publicar tablas virtuales en un catálogo
' Para previsualizar esta tarea, vea el vídeo a partir del minuto 7:18.
Ahora que los datos virtualizados se han enriquecido con términos empresariales, siga estos pasos para publicar las tablas virtuales en un catálogo:
Haga clic en Gobierno de datos en la ruta de navegación para volver al proyecto.
Pulse la pestaña Activos.
Vaya a Datos > Activos de datos.
Pulse el recuadro de selección situado junto a los activos siguientes:
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
Pulse Publicar en catálogo.
Seleccione el Catálogo de aprobación de hipoteca (o su nombre de catálogo) en la lista y pulse Siguiente.
Seleccione la opción Ir al catálogo después de publicarloy pulse Siguiente.
Revise los activos y pulse Publicar.
En el Catálogo de aprobación de hipotecas, busque
<your-schema>
.Abra una de las tablas virtuales. Si se le solicita, proporcione sus credenciales:
Para el Método de autenticación, seleccione Clave de API.
Pegue la misma clave de API que ha creado en la guía de aprendizaje Virtualizar datos externos .
Pulse el separador Activo para ver los datos. Las reglas de protección de datos se aplican en la vista previa del catálogo, la descarga del catálogo, Data Refineryy la vista previa de Activo de proyecto. La regla no se aplica al propietario del activo. ' Mira el video en 08:17 para ver lo que otros usuarios ven tratando de acceder a la tabla de datos virtual en el catálogo.
' Comprueba tu progreso
La imagen siguiente muestra la vista previa de datos de la tabla virtual en el catálogo desde la perspectiva del usuario.
Como ingenieros de datos y encargados de datos en Golden Bank, ha enriquecido los datos virtualizados para asegurarse de que los datos virtualizados están protegidos.
Limpieza (opcional)
Si desea volver a tomar las guías de aprendizaje en el caso de uso de gobierno de datos, consulte la sección Limpieza en cada una de las guías de aprendizaje de requisito previo:
Próximos pasos
Pruebe estas guías de aprendizaje:
Regístrese para otro caso de uso de entramado de datos.
Más información
Tema padre: Guías de aprendizaje de casos de uso