guía de aprendizaje: Proteger los datos

Utilice esta guía de aprendizaje para proteger los datos con el caso de uso de Data Governance and Privacy de la prueba de entramado de datos. Su objetivo es controlar el acceso a los datos a través de los servicios del entramado de datos.

La historia de la guía de aprendizaje corresponde a Golden Bank, que tiene varios departamentos que necesitan acceso a datos de alta calidad sobre hipotecas de cliente. Como representante de datos en el equipo de gobierno, creará reglas de protección de datos y creará flujos de enmascaramiento para proteger los datos confidenciales de las hipotecas.

En esta guía de aprendizaje, realizará estas tareas:

  1. Crear una regla de protección de datos para denegar el acceso.
  2. Crear una regla de protección de datos para enmascarar datos.
  3. Importar datos en el proyecto.
  4. Enriquecer los datos.
  5. Ver los resultados del enriquecimiento de metadatos.
  6. Crear un catálogo.
  7. Publicar activos en un catálogo.

Si necesita ayuda con esta guía de aprendizaje, plantee una pregunta o busque una respuesta en el foro de debate de la comunidad de Cloud Pak for Data.

Consejo: Para aprovechar al máximo esta guía de aprendizaje, abra Cloud Pak for Data as a Service en una pestaña del navegador y mantenga abierta esta página de la guía de aprendizaje en otra pestaña del navegador para cambiar fácilmente entre las dos aplicaciones.

Requisitos previos

Debe registrarse para Cloud Pak for Data as a Service y suministrar los servicios necesarios para el caso de uso de Data Governance and Privacy.

Puede registrarse para Cloud Pak for Data as a Service de cualquiera de estas formas:

Suministro de los servicios necesarios

Siga estos pasos para verificar o suministrar los servicios necesarios.

  1. En el menú de navegación de Cloud Pak for Data, elija Servicios > Instancias de servicio.
  2. Utilice el recuadro desplegable Producto para determinar si existe una instancia de servicio de Watson Knowledge Catalog existente.
  3. Si necesita crear una instancia de servicio de Watson Knowledge Catalog, pulse Añadir servicio.
  4. Seleccione Watson Knowledge Catalog.
  5. Seleccione el plan Lite.
  6. Pulse Crear.

Confíe en sus datos

Ver vídeo Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 00:47.

Complete la guía de aprendizaje de Confíe en sus datos para importar y enriquecer activos de datos y publicarlos en un catálogo.

Paso 1: Crear una regla de protección de datos para denegar el acceso

Ver vídeo Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:23.

Una regla de protección de datos controla el acceso a un activo de datos. Siga estos pasos para crear una regla de protección de datos para denegar el acceso a información confidencial en algunos de los activos de datos de hipoteca.

  1. En el menú de navegación de Cloud Pak for Data, elija Catálogos > Ver todos los catálogos.
  2. Abra el Catálogo de aprobación de hipotecas.
  3. Pulse el activo de datos CREDIT_SCORE. Observe que contiene la etiqueta confidencial. Creará una regla para denegar el acceso a este activo de datos.
  4. En el menú de navegación de Cloud Pak for Data, elija Gobierno > Reglas.
  5. Pulse Añadir regla > Nueva regla.
  6. Seleccione Regla de protección de datos.
  7. Pulse Siguiente.
  8. Para el nombre de regla, escriba Confidential Information.
  9. Para la Definición empresarial, escriba Rule to prevent unauthorized users from accessing data assets that have been tagged as confidential.
  10. Para Condición 1, seleccione las opciones siguientes.
    • Etiqueta
    • contiene cualquiera
    • Confidencial
  11. Para Acción, seleccione denegar el acceso a los datos.
  12. Pulse Crear. Esta regla denegará ahora el acceso a los datos para cualquier persona que intente acceder a los activos de datos etiquetados como "Confidencial". Esta regla se aplica a la vista previa del catálogo, la descarga de catálogo, Data Refinery y la vista previa del activo de proyecto. Tenga en cuenta que la regla no se aplica a la persona que ha creado la regla o ha añadido un activo a un proyecto. Vea el vídeo a las XX:XX para ver qué otros usuarios verán que se intenta acceder al activo de datos CREDIT_SCORE.

Paso 2: Crear una regla de protección de datos para enmascarar datos

Ver vídeo Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:23.

Siga estos pasos para crear una regla de protección de datos que enmascare los activos de datos que contienen columnas con un número de seguridad social de EE. UU.

  1. En Catálogo de aprobación de hipotecas, pulse el activo de datos MORTGAGE_APPLICANTS.
  2. Pulse la pestaña Activo para obtener una vista preliminar de los datos. Observe que una de las columnas contiene números de seguridad social. Creará una regla para enmascarar esta columna.
  3. En el menú de navegación de Cloud Pak for Data, elija Gobierno > Reglas.
  4. Pulse Añadir regla > Nueva regla.
  5. Seleccione Regla de proyección de datos.
  6. Pulse Siguiente.
  7. Para el nombre de regla, escriba Redact Social Security Number.
  8. Para la Definición empresarial, escriba Rule to redact Social Security Number.
  9. Para Condición 1, seleccione las opciones siguientes:
    • Término empresarial
    • contiene cualquiera
    • Número de seguridad social
  10. Para Acción, seleccione enmascarar datos. Término empresarial y Número de Seguridad Social se cumplimentarán automáticamente.
  11. Para las opciones de enmascaramiento, seleccione Ocultar. Esto sustituirá los datos por X. Puede pasar el puntero del ratón sobre cada opción de enmascaramiento para ver datos de ejemplo enmascarados utilizando la opción seleccionada.
  12. Pulse Crear. Esta regla oculta las columnas con números de seguridad social de EE.UU. en activos de datos. Vea el vídeo a las XX:XX para ver qué otros usuarios verán el acceso al activo de datos MORTGAGE_APPLICANTS.

Paso 3: Crear una regla de protección de datos con enmascaramiento avanzado

Ver vídeo Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:23.

Siga estos pasos para crear una regla de protección de datos que enmascarará los activos de datos que contienen columnas con una dirección de correo electrónico.

  1. En el menú de navegación de Cloud Pak for Data, elija Catálogos > Ver todos los catálogos.
  2. Abra el Catálogo de aprobación de hipotecas.
  3. Pulse el activo de datos MORTGAGE_APPLICANTS. Observe que una de las columnas contiene la dirección de correo electrónico. Creará una regla para enmascarar esta columna utilizando un enmascaramiento avanzado.
  4. En el menú de navegación de Cloud Pak for Data, elija Gobierno > Reglas.
  5. Pulse Añadir regla > Nueva regla.
  6. Seleccione Regla de proyección de datos.
  7. Pulse Siguiente.
  8. Para el nombre de regla, escriba Obfuscate email address.
  9. Para la Definición empresarial, escriba Rule to obfuscate the email address using advanced masking options.
  10. Para Condición 1, seleccione las opciones siguientes:
    • Clase de datos
    • contiene cualquiera
    • Dirección de correo electrónico
  11. Para Acción, seleccione enmascarar datos.
  12. Para el campo en columnas que contengan, seleccione Clase de datos. Dirección de correo electrónico se cumplimentará automáticamente.
  13. Para las opciones de enmascaramiento, seleccione Ofuscar.
  14. Seleccione Habilitar opciones de enmascaramiento avanzadas.
  15. Seleccione Renovar automáticamente vista preliminar para renovar la vista preliminar cada vez para realizar un cambio en una opción.
  16. Para Método de ofuscación, seleccione Conservar formato. El método de conservar formato le permite generar un nombre de usuario o proporcionar un prefijo y un número para el nombre de usuario.
    1. Seleccione Prefijo más número y escriba mail para ver una vista previa.
    2. En este escenario, sería mejor seleccionar Generar nombre de usuario.
  17. La opción Nombre de dominio incluye tres opciones:
    1. Seleccione Servicios de correo electrónico comunes para obtener una vista preliminar de cómo se vería la dirección de correo electrónico.
    2. Seleccione Personalizado para obtener una vista preliminar de cómo se vería la dirección de correo electrónico.
    3. Para este escenario, sería mejor seleccionar Original.
  18. Para Reversabilidad, la única opción es Enmascaramiento irreversible, que es permanente. Para otros tipos de datos, es posible que tenga la opción de seleccionar Enmascaramiento reversible que le permite recuperar los valores originales utilizando una Clave de cifrado.
  19. Para Coherencia, seleccione Repetible. La opción Repetible garantiza que el enmascaramiento se hará con integridad referencial, lo que significa que cada vez que la dirección de correo electrónico es smith.lee, se sustituirá por shoshana.vitrano.
  20. Para Validación de entrada, mantenga el valor predeterminado de Validación de entrada. La opción de validación de entrada comprobará si hay un valor incorrecto y eliminará las filas con valores que no tengan el formato correcto.
  21. Pulse Crear. Con esta regla en vigor, los datos de acatalog están protegidos para los usuarios de datos, cuando visualicen de forma previa dinámicamente los datos en el catálogo, o cuando extraigan estáticamente copias de datos a través de un flujo de enmascaramiento. Vea el vídeo a las XX:XX para ver qué otros usuarios verán el acceso al activo de datos MORTGAGE_APPLICANTS.

Paso 4: Crear un flujo de enmascaramiento

Ver vídeo Para obtener una vista previa de esta tarea, vea el vídeo que empieza en 02:23.

Un flujo de enmascaramiento establece y envía copias enmascaradas o subconjuntos enmascarados de datos del catálogo a diferentes bases de datos de destino. Las copias creadas se eliminarán la identificación utilizando opciones avanzadas de enmascaramiento con reglas de protección de datos que el administrador ha configurado anteriormente. Siga estos pasos para crear y ejecutar un flujo de enmascaramiento.

  1. En el menú de navegación de Cloud Pak for Data, elija Catálogos > Ver todos los catálogos.
  2. Pulse Catálogo de aprobación de hipotecas.
  3. Seleccione el activo de datos MORTGAGE_APPLICANTS en el catálogo.
  4. Pulse Añadir al proyecto.
    1. Para Objetivo, seleccione el proyecto Data Governance and Privacy.
    2. Pulse Añadir.
  5. En el menú de navegación de Cloud Pak for Data, elija Proyectos > Ver todos los proyectos.
  6. Pulse el proyecto Gobierno de datos y privacidad.
  7. Pulse la pestaña Activos.
  8. Pulse Nuevo activo.
  9. Seleccione Privacidad de datos.
  10. Para el Nombre, escriba Applicants in California.
  11. Para la Descripción, escriba Creates masked copy of applicants and related recrods for applicants in California.
  12. Pulse Siguiente.
  13. Hay dos tipos de enmascaramiento. Copiar una o varias tablas genera copias enmascaradas de tablas sin buscar relaciones. Copiar una tabla de controlador más datos relacionados le permite crear subconjuntos de datos con relaciones de clave primaria y clave foránea y tener subconjuntos relacionados. En este caso de ejemplo, seleccione Copiar una o más tablas.
  14. Pulse Añadir datos del proyecto.
    1. Seleccione la conexión Prueba de entramado de datos - Db2 Warehouse .
    2. Seleccione el esquema de AI_MORTGAGE.
    3. Seleccione la tabla MORTGAGE_APPLICANTS.
    4. Pulse Seleccionar. Observe que se reconoce que este activo incluye columnas enmascaradas.
  15. Pulse Definir.
    1. Junto a la columna ESTADO, pulse + (signo más).
    2. Para el valor, escriba California.
    3. Pulse Guardar para guardar ese valor.
    4. Vuelva a pulsar Guardar para volver a la página Crear un flujo de enmascaramiento.
  16. Pulse Crear trabajo.
    1. Para el Nombre, escriba Applicants in California.
    2. Pulse Siguiente.
    3. Para Conexión de destino, seleccione la conexión Prueba de entramado de datos - Db2 Warehouse.
    4. Para el Esquema de destino, seleccione BANKING.
    5. Pulse Siguiente para continuar con la partición.
  17. Pulse Siguiente para continuar con la planificación.
  18. Pulse Siguiente para continuar con la revisión.
  19. Pulse Crear y ejecutar trabajo.
  20. Cuando la ejecución del trabajo esté completa, puede navegar hasta la base de datos de destino para ver los resultados. Vea el vídeo a las XX:XX para ver cómo se ve la tabla en la instancia de Db2 Warehouse.

Próximos pasos

Ahora está preparado para conocer sus datos evaluando, compartiendo, configurando y analizando datos en el entramado de datos.Consulte la guía de aprendizaje de Conozca sus datos.

Más información

Tema principal: Guías de aprendizaje de entramado de datos