Muchas empresas tienen dificultades para equilibrar las ventajas de proporcionar acceso a los datos con la necesidad de proteger los datos confidenciales. Cloud Pak for Data as a Service proporciona los métodos que su empresa necesita para automatizar el gobierno de datos para asegurarse de que los datos sean accesibles y estén protegidos.
Vea este vídeo para ver el caso de uso del entramado de datos para implementar una solución de gobierno de datos en Cloud Pak for Data.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Desafíos
Muchas empresas se enfrentan a los siguientes retos de gobierno de datos:
- Proporcionar privacidad de datos a escala
- Las organizaciones deben cumplir con las normativas de privacidad de datos para los datos en orígenes de datos en varias plataformas cloud y en local.
- Acceso a datos de alta calidad
- Las organizaciones deben proporcionar acceso a datos empresariales de alta calidad en varios equipos.
- Creación de un perfil de cliente completo
- Los equipos necesitan crear vistas precisas de los clientes a escala, rápidamente, para optimizar los procesos de autoservicio y la administración de datos.
- Proporcionar consumo de datos de autoservicio
- Los consumidores de datos, como los científicos de datos, tienen dificultades para encontrar y utilizar los datos que necesitan.
Puede resolver estos retos implementando un entramado de datos con Cloud Pak for Data as a Service.
Ejemplo: Los retos de Golden Bank
Siga la historia de Golden Bank mientras el equipo de gobierno implementa el gobierno de datos. Golden Bank tiene una gran cantidad de datos de clientes e hipotecas que incluyen datos confidenciales. El banco quiere garantizar la calidad de los datos, enmascarar los datos sensibles y ponerla a disposición para su uso en varios departamentos.
Proceso
La forma de implementar el gobierno de datos depende de las necesidades de su organización. Puede implementar el gobierno de datos de forma lineal o iterativa. Puede basarse en características predeterminadas y artefactos predefinidos, o personalizar la solución.
Para implementar el gobierno de datos, su organización puede seguir este proceso:
- Establecer su vocabulario de negocio
- Definir reglas para proteger los datos
- Curar y consolidar los datos
- Compartir los datos en catálogos
El servicio IBM Knowledge Catalog en Cloud Pak for Data proporciona las herramientas y los procesos que su organización necesita para implementar una solución de gobierno de datos.
1. Establezca su vocabulario de negocios
Para cumplir los retos, el equipo debe establecer un vocabulario empresarial importando o creando artefactos de gobernabilidad que actúen como metadatos para clasificar y describir los datos:
- Antes de poder automatizar la privacidad de los datos, su equipo debe asegurarse de que los datos a controlar se identifiquen con precisión.
- Para poder analizar la calidad de los datos, debe identificar el formato de los datos.
- Para que los datos sean fáciles de encontrar, su equipo debe asegurarse de que el contenido de los datos se describe con precisión.
En este primer paso del proceso, el equipo de gobierno puede crear sobre la base de los artefactos de gobierno predefinidos y crear artefactos de gobierno personalizados que sean específicos de su organización. Puede crear artefactos para describir el formato, el significado empresarial, la sensibilidad, el rango de valores y las políticas de gobierno de los datos.
Qué puede utilizar | Qué puede hacer | Cuándo utilizarlos mejor |
---|---|---|
Categorías | Utilice la categoría predefinida para almacenar los artefactos de gobernabilidad. Cree categorías para organizar los artefactos de gobernabilidad en una estructura jerárquica similar a las carpetas. Añada colaboradores con roles que definan sus permisos en los artefactos de la categoría. |
Necesita más que la categoría predefinida. Desea un control preciso de quién puede poseer, crear y ver artefactos de gobernabilidad. |
flujos de trabajo | Utilice la configuración de flujo de trabajo predeterminada que no restringe quién crea artefactos de gobernabilidad o requiere revisiones. Configure flujos de trabajo para artefactos de gobernabilidad y designe quién puede crear qué tipos de artefactos de gobernabilidad en qué categorías. |
Desea controlar quién crea artefactos de gobernabilidad. Desea que los artefactos de gobernabilidad de borrador se revisen antes de que se publiquen. |
Artefactos de gobernabilidad | Utilice los términos de negocio predefinidos, las clases de datos y las clasificaciones. Cree artefactos de gobernabilidad que actúen como metadatos para enriquecer, definir y controlar activos de datos. |
Desea añadir conocimiento y significado a los activos para ayudar a las personas a comprender los datos. Desea mejorar el análisis de calidad de los datos. |
Knowledge Accelerators | Importe un conjunto de artefactos de gobierno predefinidos para mejorar la clasificación de datos, el cumplimiento normativo, el análisis de autoservicio y otras operaciones de gobierno. | Necesita un vocabulario estándar para describir problemas empresariales, rendimiento empresarial, estándares del sector y normativas. Desea ahorrar tiempo importando artefactos de gobierno creados previamente. |
Ejemplo: vocabulario empresarial de Golden Bank
El líder del equipo de gobierno de Golden Bank empieza creando una categoría, Banca, para contener los artefactos de gobierno que el equipo tiene previsto crear. El jefe de equipo añade el resto de los miembros del equipo de gobierno como colaboradores a la categoría Banca con el rol Editor para que tengan permiso para crear artefactos de gobierno. A continuación, el jefe de equipo configura los flujos de trabajo para que un miembro de equipo diferente sea responsable de crear cada tipo de artefacto. Todos los flujos de trabajo requieren un paso de aprobación por parte del jefe de equipo.
Un miembro del equipo de gobierno importa un conjunto de términos empresariales de una hoja de cálculo. Algunos de los términos de negocio están asociados a las ocupaciones de los clientes personales. Otro miembro del equipo crea un conjunto de datos de referencia, "Profesiones", que contiene una lista de ocupaciones, donde cada ocupación tiene un número de ID. Un tercer miembro del equipo crea una clase de datos personalizada, "Profesión" para identificar la profesión de los clientes personales, basándose en el conjunto de datos de referencia.
2. Definir reglas para proteger los datos
En el siguiente paso del proceso, el equipo define reglas para garantizar el cumplimiento de las normativas de privacidad de datos controlando quién puede ver qué datos. Su equipo crea reglas de protección de datos para definir cómo proteger los datos en los catálogos gobernados. El equipo puede utilizar estas reglas de protección de datos para enmascarar datos confidenciales basándose en el contenido, el formato o el significado de los datos, o la identidad de los usuarios que acceden a los datos.
Qué puede utilizar | Qué puede hacer | Cuándo utilizarlos mejor |
---|---|---|
Reglas de protección de datos | Proteja la información confidencial del acceso no autorizado en catálogos gobernados denegando el acceso a datos, enmascarando valores de datos o filtrando filas en activos de datos. enmascarar datos de forma dinámica y coherente en catálogos gobernados a un nivel granular definido por el usuario. |
Necesita aplicar automáticamente la privacidad de los datos en los catálogos gobernados. Desea conservar la disponibilidad y la utilidad de los datos mientras también cumple con las normativas de privacidad. |
Flujos de enmascaramiento | Utilice prestaciones avanzadas de enmascaramiento de datos que conserven el formato cuando extraiga copias o subconjuntos de datos de producción. | Necesita datos de entrenamiento anónimos y conjuntos de pruebas que conserven la integridad de los datos. |
Políticas y reglas de gobierno | Describa y documente las directrices, normativas, estándares o procedimientos de la organización para la seguridad de datos. Describa el comportamiento o las acciones necesarias para implementar la política de gobierno. |
Desea que las personas que utilizan los datos entiendan las políticas de gobierno de datos. |
Ejemplo: Reglas de protección de datos de Golden Bank
Para crear un modelo predictivo para las aprobaciones de hipotecas, los científicos de datos de Golden Bank necesitan acceso a conjuntos de datos que incluyan datos confidenciales. Por ejemplo, los científicos de datos desean acceder a la tabla con datos sobre solicitantes de hipoteca, que incluye una columna con números de seguridad social.
Un miembro del equipo de gobierno crea una regla de protección de datos que enmascara los números de la seguridad social. Si la clase de datos asignada de una columna de un activo de datos es "US Social Security Number", los valores de esa columna se sustituyen por 10 X.
Un miembro del equipo de gobierno crea una política que incluye la regla de protección de datos. La política describe las razones empresariales para implementar la regla.
3. Curar datos para compartir en catálogos
Los encargados de datos curan activos de datos de alta calidad en proyectos y los publican en catálogos donde las personas que necesitan los datos pueden encontrarlos. Los encargados de datos enriquecen los activos de datos asignando artefactos de gobernabilidad como metadatos que describen los datos e informan a la búsqueda semántica de datos.
Qué puede utilizar | Qué puede hacer | Cuándo utilizarlos mejor |
---|---|---|
Metadata import | Importar automáticamente metadatos técnicos para los datos que están asociados con una conexión para crear activos de datos. | Es necesario crear muchos activos de datos a partir de un origen de datos. Es necesario renovar los activos de datos que ha importado anteriormente. |
Enriquecimiento de metadatos | Perfilar varios activos de datos en una sola ejecución para asignar automáticamente clases de datos e identificar tipos de datos y formatos de columnas. Asignar automáticamente términos empresariales a activos y generar sugerencias de términos basadas en la clasificación de datos. Vuelva a ejecutar los trabajos de importación y enriquecimiento a intervalos para descubrir y evaluar los cambios en los activos de datos. |
Necesita organizar y publicar muchos activos de datos que ha importado. |
Análisis de calidad de datos | Ejecute comprobaciones de calidad de datos en los conjuntos de datos para buscar problemas de calidad en los datos. Seguimiento continuo de los cambios en el contenido y la estructura de los datos, y análisis recurrente de los datos cambiados. |
Debe saber si la calidad de los datos puede afectar a la precisión del análisis de datos o de los modelos. Los usuarios deben identificar qué conjuntos de datos deben remediarse. |
Ejemplo: Curación de datos de Golden Bank
Los encargados de datos del equipo de gobierno empiezan a importar metadatos para crear activos de datos en un proyecto. Después de la importación de metadatos, Golden Bank tiene dos activos de datos que representan tablas con una columna denominada "ID". Después del enriquecimiento de metadatos, estas columnas se diferencian claramente por sus metadatos asignados:
- A una columna se le asignan los términos empresariales "Ocupación" y "Profesión", y la clase de datos "Profesión".
- A la otra columna se le asignan los términos empresariales "Personal identifier" y "Private individual" y la clase de datos "US Social Security Number".
Los encargados de datos ejecutan el análisis de calidad de datos en los activos de datos para asegurarse de que la puntuación de calidad de datos global supera el umbral de Golden Bank del 95%.
El líder del equipo de gobierno crea un catálogo, "Catálogo de aprobación hipotecaria" y añade los encargados de datos y los científicos de datos como colaboradores del catálogo. Los encargados de datos publican los activos de datos que han creado en el proyecto en el catálogo.
4. Compartir o trabajar con sus datos
El catálogo ayuda a sus equipos a comprender sus datos y hace que los datos adecuados estén disponibles para el uso correcto. Los científicos de datos y otros tipos de usuarios pueden ayudarse a sí mismos a los datos que necesitan mientras siguen cumpliendo con las políticas de protección de datos y acceso corporativo. Pueden añadir activos de datos de un catálogo a un proyecto, donde colaboran para preparar, analizar y modelar los datos.
Qué puede utilizar | Qué puede hacer | Cuándo utilizarlos mejor |
---|---|---|
Catálogos | Organice sus activos para compartir entre los colaboradores de su organización. Aproveche la búsqueda semántica basada en IA y las recomendaciones para ayudar a los usuarios a encontrar lo que necesitan. |
Los usuarios necesitan comprender, colaborar, enriquecer y acceder fácilmente a los datos de alta calidad. Desea aumentar la visibilidad de los datos y la colaboración entre usuarios empresariales. Necesitará que los usuarios vean, accedan, manipulen y analicen los datos sin comprender su formato físico o ubicación, y sin tener que moverlos o copiarlos. Desea que los usuarios mejoren los activos valorando y revisando los activos. |
Búsqueda global | Busque activos en todos los proyectos, catálogos y espacios de despliegue a los que tiene acceso. Busque artefactos de gobernabilidad en las categorías a las que tiene acceso. |
Necesita encontrar datos u otro tipo de activo, o un artefacto de gobernabilidad. |
Data Refinery | Limpie los datos para arreglar o eliminar datos incorrectos, incompletos, con formato incorrecto o duplicados. Forma los datos para personalizarlos filtrando, ordenando, combinando o eliminando columnas. |
Es necesario mejorar la calidad o la utilidad de los datos. |
Ejemplo: Catálogo de Golden Bank
Los científicos de datos encuentran los activos de datos que necesitan en el catálogo y los copian en un proyecto. En su proyecto, los científicos de datos pueden refinar los datos para prepararlos para entrenar un modelo.
Guías de aprendizaje para el gobierno de datos
Guía de aprendizaje | Descripción | Experiencia para guía de aprendizaje |
---|---|---|
Curar datos de alta calidad | Cree activos de datos de alta calidad enriqueciendo sus datos y ejecutando análisis de calidad de datos. | Ejecute las herramientas de enriquecimiento de Metadata import y Metadata. |
Proteja sus datos | Controle el acceso a los datos en Cloud Pak for Data as a Service. | Crear reglas de protección de datos. |
Consumir los datos | Buscar, dar forma y analizar datos. | Explore un catálogo y ejecute la herramienta Data Refinery . |
Gobernar datos virtualizados | Enriquezca los datos virtualizados y asegúrese de que los datos virtuales estén protegidos. | Utilice la interfaz, los proyectos y los catálogos de Data Virtualization para controlar los datos virtualizados. |
Más información sobre el gobierno de datos
- Guías de aprendizaje de casos de uso
- Visión general deIBM Knowledge Catalog
- Configuración de IBM Knowledge Catalog
- Planificación de la implementación en el gobierno de datos
- Vídeos
Tema principal: Casos de uso