0 / 0
Volver a la versión inglesa de la documentación
Caso de uso de privacidad y gobierno de datos
Caso de uso de privacidad y gobierno de datos

Caso de uso de privacidad y gobierno de datos

Muchas empresas tienen dificultades para equilibrar las ventajas de proporcionar acceso a los datos con la necesidad de proteger los datos confidenciales. Cloud Pak for Data as a Service proporciona los métodos que necesita su empresa para automatizar el gobierno y la privacidad de los datos para asegurarse de que los datos sean accesibles y estén protegidos.

Vea este vídeo para ver el caso de uso de entramado de datos para implementar una solución de Data governance and privacy en Cloud Pak for Data.

Este vídeo proporciona un método visual como una alternativa a seguir los pasos escritos incluidos en esta documentación.

Desafíos

Muchas empresas se enfrentan a los siguientes retos de privacidad y gobierno de datos:

Proporcionar privacidad de datos a escala
Las organizaciones deben cumplir con las normativas de privacidad de datos para los datos en orígenes de datos en varias plataformas de nube y en local.

Acceso a datos de alta calidad
Las organizaciones deben proporcionar acceso a datos empresariales de alta calidad en varios equipos.

Proporcionar consumo de datos de autoservicio
Los consumidores de datos, como los científicos de datos, tienen dificultades para encontrar y utilizar los datos que necesitan.

Puede resolver estos retos implementando un entramado de datos con Cloud Pak for Data as a Service.

Ejemplo: Los retos de Golden Bank

Siga la historia de Golden Bank mientras el equipo de gobierno implementa el gobierno de datos. Golden Bank tiene una gran cantidad de datos de clientes e hipotecas que incluyen datos confidenciales. El banco quiere garantizar la calidad de los datos, enmascarar los datos sensibles y ponerla a disposición para su uso en varios departamentos.

Proceso

Para implementar el gobierno y la privacidad de los datos, su organización puede seguir este proceso:

  1. Configurar una infraestructura de gobierno
  2. Crear reglas para proteger los datos
  3. Curar datos para compartir en catálogos
  4. Buscar y utilizar datos

El servicio Watson Knowledge Catalog en Cloud Pak for Data as a Service proporciona todas las herramientas y procesos que su organización necesita para implementar una solución de privacidad y gobierno de datos.

Imagen que muestra el flujo de activos en el caso de uso de privacidad y gobierno de datos

1. Configurar un marco de gobierno

Para cumplir los tres retos, el equipo debe configurar una infraestructura de artefactos de gobernabilidad que actúe como metadatos para clasificar y describir los datos:

  • Antes de poder automatizar la privacidad de los datos, su equipo debe asegurarse de que los datos a controlar se identifiquen con precisión.
  • Para poder analizar la calidad de los datos, debe identificar el formato de los datos.
  • Para que los datos sean fáciles de encontrar, su equipo debe asegurarse de que el contenido de los datos se describe con precisión.

En este primer paso del proceso, el equipo de gobierno puede crear sobre la base de los artefactos de gobierno predefinidos y crear artefactos de gobierno personalizados que sean específicos de su organización. Puede crear artefactos para describir el formato, el significado empresarial, la sensibilidad, el rango de valores y las políticas de gobierno de los datos.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Categorías Utilice la categoría predefinida para almacenar los artefactos de gobernabilidad.

Cree categorías para organizar los artefactos de gobernabilidad en una estructura jerárquica similar a las carpetas.

Añada colaboradores con roles que definan sus permisos en los artefactos de la categoría.
Necesita más que la categoría predefinida.

Desea un control preciso de quién puede poseer, crear y ver artefactos de gobernabilidad.
Flujos de trabajo Utilice la configuración de flujo de trabajo predeterminada que no restringe quién crea artefactos de gobernabilidad o requiere revisiones.

Configure flujos de trabajo para artefactos de gobernabilidad y designe quién puede crear qué tipos de artefactos de gobernabilidad en qué categorías.
Desea controlar quién crea artefactos de gobernabilidad.

Desea que los artefactos de gobernabilidad de borrador se revisen antes de que se publiquen.
Artefactos de gobernabilidad Utilice las clases de datos y clasificaciones predefinidas.

Cree artefactos de gobernabilidad que actúen como metadatos para enriquecer, definir y controlar activos de datos.
Desea añadir conocimiento y significado a los activos para ayudar a las personas a comprender los datos.

Desea mejorar el análisis de calidad de los datos.
Knowledge Accelerators Importe un conjunto de artefactos de gobierno predefinidos para mejorar la clasificación de datos, el cumplimiento normativo, el análisis de autoservicio y otras operaciones de gobierno. Necesita un vocabulario estándar para describir problemas empresariales, rendimiento empresarial, estándares del sector y normativas.

Desea ahorrar tiempo importando artefactos de gobierno creados previamente.


Ejemplo: Marco de gobierno de Golden Bank

El líder del equipo de gobierno de Golden Bank empieza creando una categoría, Banca, para contener los artefactos de gobierno que el equipo tiene previsto crear. El jefe de equipo añade el resto de los miembros del equipo de gobierno como colaboradores a la categoría Banca con el rol Editor para que tengan permiso para crear artefactos de gobierno. A continuación, el jefe de equipo configura los flujos de trabajo para que un miembro de equipo diferente sea responsable de crear cada tipo de artefacto. Todos los flujos de trabajo requieren un paso de aprobación por parte del jefe de equipo.

Un miembro del equipo de gobierno importa un conjunto de términos empresariales de una hoja de cálculo. Algunos de los términos de negocio diferencian entre clientes personales y comerciales. Otro miembro del equipo crea un conjunto de datos de referencia, "Nombres de cliente de nivel Diamante", que contiene una lista de los principales clientes comerciales. Un tercer miembro del equipo crea una clase de datos personalizada, "clientes de nivel Diamante", para identificar los principales clientes comerciales, basándose en el conjunto de datos de referencia.

2. Cree reglas para proteger sus datos

En el siguiente paso del proceso, el equipo configura reglas para garantizar el cumplimiento de las normativas de privacidad de datos controlando quién puede ver qué datos. Su equipo crea reglas de protección de datos que protegen los datos en toda la plataforma. El equipo puede utilizar estas reglas de protección de datos para enmascarar datos confidenciales basándose en el contenido, el formato o el significado de los datos, o la identidad de los usuarios que acceden a los datos.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Reglas de protección de datos Proteger la información confidencial del acceso no autorizado denegando el acceso o enmascarando valores de datos en activos de datos.

enmascarar datos de forma dinámica y coherente en un nivel granular definido por el usuario.
Necesita imponer automáticamente la privacidad de los datos en toda la plataforma.

Desea conservar la disponibilidad y el programa de utilidad de los datos mientras también cumple con las normativas de privacidad.
Flujos de enmascaramiento Utilice prestaciones avanzadas de enmascaramiento de datos que conserven el formato cuando extraiga copias o subconjuntos de datos de producción. Necesita datos de entrenamiento anónimos y conjuntos de pruebas que conserven la integridad de los datos.
Políticas y reglas de gobierno Describa y documente las directrices, normativas, estándares o procedimientos de la organización para la seguridad de datos.

Describa el comportamiento o las acciones necesarias para implementar la política de gobierno.
Desea que las personas que utilizan los datos entiendan las políticas de gobierno de datos.


Ejemplo: Reglas de protección de datos de Golden Bank

Para crear un modelo predictivo para las aprobaciones de hipotecas, los científicos de datos de Golden Bank necesitan acceso a conjuntos de datos que incluyan datos confidenciales. Por ejemplo, los científicos de datos desean acceder a la tabla con datos sobre solicitantes de hipoteca, que incluye una columna con números de seguridad social.

Un miembro del equipo de gobierno crea una regla de protección de datos que enmascara los números de la seguridad social. Si la clase de datos asignada de una columna de un activo de datos es "US Social Security Number", los valores de esa columna se sustituyen por 10 X.

Un miembro del equipo de gobierno crea una política que incluye la regla de protección de datos. La política describe las razones empresariales para implementar la regla. Posteriormente, cuando los usuarios, como los científicos de datos, ven el icono enmascarado en una columna de datos, pueden ver la regla de protección de datos y, a continuación, ver la política asociada para comprender por qué se enmascaran los datos.

3. Curar datos para compartir en catálogos

Los encargados de datos curan activos de datos de alta calidad en proyectos y los publican en catálogos donde las personas que necesitan los datos pueden encontrarlos. Los encargados de datos enriquecen los activos de datos asignando artefactos de gobernabilidad como metadatos que describen los datos e informan a la búsqueda semántica de datos.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Metadata import Importar automáticamente metadatos técnicos para los datos que están asociados con una conexión para crear activos de datos. Es necesario crear muchos activos de datos a partir de un origen de datos.

Es necesario renovar los activos de datos que ha importado anteriormente.
Enriquecimiento de metadatos Perfilar varios activos de datos en una sola ejecución para asignar automáticamente clases de datos e identificar tipos de datos y formatos de columnas.

Asignar automáticamente términos empresariales a activos y generar sugerencias de términos basadas en la clasificación de datos.

Vuelva a ejecutar los trabajos de importación y enriquecimiento a intervalos para descubrir y evaluar los cambios en los activos de datos.
Necesita organizar y publicar muchos activos de datos que ha importado.
Análisis de calidad de datos Ejecutar análisis de calidad en varios conjuntos de datos en una sola ejecución para explorar dimensiones comunes de calidad de datos como valores perdidos o infracciones de clase de datos.
Seguimiento continuo de los cambios en el contenido y la estructura de los datos y análisis recurrente de los datos cambiados.
Debe saber si la calidad de los datos puede afectar a la precisión del análisis de datos o de los modelos.

Los usuarios deben identificar qué conjuntos de datos deben remediarse.
Catálogos Publique activos organizados para compartirlos entre los colaboradores de su organización. Necesita un repositorio central para almacenar activos de datos que muestre los metadatos asociados, las relaciones y el historial de los activos.


Ejemplo: Curación de datos de Golden Bank

Los encargados de datos del equipo de gobierno empiezan a importar metadatos para crear activos de datos en un proyecto. Después de la importación de metadatos, Golden Bank tiene dos activos de datos que representan tablas con una columna denominada "ID". Después del enriquecimiento de metadatos, estas columnas se diferencian claramente por sus metadatos asignados:

  • A una columna se le asignan los términos de negocio "Cliente comercial" e "Identificador de empresa", y la clase de datos "Clientes a nivel de diamante".
  • A la otra columna se le asignan los términos empresariales "Personal identifier" y "Private individual" y la clase de datos "US Social Security Number".

Los encargados de datos ejecutan el análisis de calidad de datos en los activos de datos para asegurarse de que la puntuación de calidad de datos global supera el umbral de Golden Bank del 95%.

El líder del equipo de gobierno crea un catálogo, "Catálogo de aprobación hipotecaria" y añade los encargados de datos y los científicos de datos como colaboradores del catálogo. Los encargados de datos publican los activos de datos que han creado en el proyecto en el catálogo.

4. Buscar y utilizar datos

El catálogo ayuda a sus equipos a comprender sus datos y hace que los datos adecuados estén disponibles para el uso correcto. Los científicos de datos y otros tipos de usuarios pueden ayudarse a sí mismos a los datos que necesitan mientras siguen cumpliendo con las políticas de protección de datos y acceso corporativo. Pueden añadir activos de datos de un catálogo a un proyecto, donde colaboran para preparar, analizar y modelar los datos.

Qué puede utilizar Qué puede hacer Cuándo utilizarlos mejor
Catálogos Organice sus activos para compartir entre los colaboradores de su organización.

Aproveche la búsqueda semántica basada en IA y las recomendaciones para ayudar a los usuarios a encontrar lo que necesitan.
Los usuarios necesitan comprender, colaborar, enriquecer y acceder fácilmente a los datos de alta calidad.

Desea aumentar la visibilidad de los datos y la colaboración entre usuarios empresariales.

Necesitará que los usuarios vean, accedan, manipulen y analicen los datos sin comprender su formato físico o ubicación, y sin tener que moverlos o copiarlos.

Desea que los usuarios mejoren los activos valorando y revisando los activos.
Búsqueda global Busque activos en todos los proyectos, catálogos y espacios de despliegue a los que tiene acceso.

Busque artefactos de gobernabilidad en las categorías a las que tiene acceso.
Necesita encontrar datos u otro tipo de activo, o un artefacto de gobernabilidad.
Data Refinery Limpie los datos para arreglar o eliminar datos incorrectos, incompletos, con formato incorrecto o duplicados.

Forma los datos para personalizarlos filtrando, ordenando, combinando o eliminando columnas.
Es necesario mejorar la calidad o la utilidad de los datos.


Ejemplo: Catálogo de Golden Bank

Los científicos de datos encuentran los activos de datos que necesitan en el catálogo y los copian en un proyecto. En su proyecto, los científicos de datos pueden refinar los datos para prepararlos para entrenar un modelo.

Guías de aprendizaje para la privacidad y el gobierno de datos

Guía de aprendizaje Descripción Experiencia para guía de aprendizaje
Confíe en sus datos Cree activos de datos de confianza enriqueciendo los datos y ejecutando el análisis de calidad de datos. Ejecute las herramientas de enriquecimiento de Metadata import y Metadata.
Proteja sus datos Controle el acceso a los datos en Cloud Pak for Data as a Service. Crear reglas de protección de datos.
Conozca sus datos Evaluar, compartir, dar forma y analizar datos. Explore un catálogo y ejecute la herramienta Data Refinery .
Gobernar datos virtualizados Enriquezca los datos virtualizados y asegúrese de que los datos virtuales estén protegidos. Utilice la interfaz, los proyectos y los catálogos de Watson Query para controlar los datos virtualizados.


Más información sobre la privacidad y el gobierno de datos

Tema padre: Visión general de la solución de entramado de datos