Las opciones avanzadas de enmascaramiento amplían la capacidad de las reglas de protección de datos y las reglas de ubicación de datos protegiendo los datos con técnicas avanzadas de desidentificación. Las técnicas mantienen el formato y la integridad de los datos. El programa de utilidad de datos de alto nivel ofrece a los usuarios de datos, tales como los científicos de datos, analistas empresariales y desarrolladores de aplicaciones, conocimientos de alta calidad de los datos protegidos.
Las opciones avanzadas de enmascaramiento incluyen las características siguientes:
- Formato que conserva la identificación de 165 clases de datos predefinidas para mantener el programa de utilidad para proyectos de IA.
Las reglas de protección de datos definidas con opciones de enmascaramiento avanzadas se aplican a IBM Data Virtualization. Las reglas pueden implementar el formato que conserva la ofuscación en cualquiera de las clases de datos predefinidas, excepto IBAN
y URL
.
- Integridad de las relaciones para proteger los datos de forma coherente en los orígenes de datos relacionados.
Los siguientes escenarios explican cómo la opción de enmascaramiento avanzado amplía la capacidad de las reglas de protección de datos.
Los científicos de datos desean utilizar datos financieros, tales como los números de tarjetas de crédito y los números de cuentas bancarias en su modelo de aprendizaje de máquina para predecir las transacciones fraudulentas. Los números de tarjeta de crédito no pueden ser XXXXXXXXX para generar los resultados que se están buscando. En su lugar, requieren números de tarjeta de crédito reales. El método de preservar el formato en el enmascaramiento avanzado de opiáceos produce números de tarjeta de crédito que cumplen con los requisitos de formato. Los requisitos de formato incluyen el mantenimiento de la información del identificador de emisión (especificando qué empresa de tarjetas de crédito (Visa, Mastercard, etc.) ha emitido la tarjeta), el algoritmo de suma de comprobación luhn, etc. El enmascaramiento realista garantiza que los usuarios de datos puedan generar resultados precisos.
Los usuarios de datos de atención sanitaria desean utilizar los datos de los pacientes que contienen información sobre el nombre y la dirección de los pacientes para analizar los resultados de los estudios clínicos de enfermedades terminales. El nombre del paciente no se puede enmascarar mediante "XXXX" para generar los resultados que están buscando. En su lugar, necesitan nombres realistas y nombres de calles, ciudades y países realistas. Como resultado, cuando los usuarios de datos están realizando los análisis, tienen un contexto más amplio que "Jane Doe" que vive en "123 Maple Lane" y participa en el estudio con cáncer de mama.
Debido a la especificidad de las opciones avanzadas de enmascaramiento, estas opciones solo se pueden aplicar a una clase de datos a la vez. Estas opciones están optimizadas para las 165 clases de datos de IBM Knowledge Catalog predefinidas y se recomiendan como las mejores opciones de conservación de formato para cada clase de datos. Sin embargo, no se pueden aplicar a las clases de datos de IBM Knowledge Catalog definidas de forma personalizada.
La opción de enmascaramiento avanzada solo se puede habilitar para los métodos de enmascaramiento Ocultar y Oscurecer. Las opciones de enmascaramiento avanzadas se aplican a las reglas utilizando mask data in columns containing data class
. Términos empresariales, nombres de columnas y etiquetas que todavía no están soportadas.
Creación de reglas de protección de datos con opciones avanzadas de enmascaramiento
Las opciones del enmascaramiento avanzadas solo se habilitan para las clases de datos.
Complete las condiciones y seleccione los atributos que desea procesar. El método recomendado es crear reglas de uno de los modos siguientes:
Si la clase de datos contiene cualquier
__insert data class__
, enmascara datos en columnas que contengan la clase de datos__insert data class__
.Opcionalmente, añada condiciones a los propietarios de activos, términos empresariales, etiquetas, etc., pero preste atención y comprenda cómo funcionan estos artefactos de gobierno. Es posible que se filtren datos desenmascarados de forma no intencionada. Consulte Gestión de reglas de protección de datos.
Enmascarar datos de entrada que son pequeños, como por ejemplo valores booleanos o números de un solo dígito, puede parecer que los datos no se han enmascarado al ejecutar un trabajo de flujo de enmascaramiento, previsualizar o descargar los datos. Sin embargo, los datos están enmascarados y el valor enmascarado es el mismo que el valor desenmascarado.
Seleccione el método siguiente para enmascarar datos:
- Ocultar columnas
- Enmascarar columnas
No se da soporte a la sustitución para el enmascaramiento avanzado.
Seleccione las opciones de enmascaramiento en la sección Opciones avanzadas de enmascaramiento. Algunas opciones están seleccionadas de forma predeterminada. Consulte Método de ocultación datos y Método de oscurecimiento de datos para obtener más información.
Crear una regla. Consulte Datos de máscara para obtener más información sobre cómo enmascarar datos en activos.
Utilización de vistas previas de enmascaramiento
La vista previa anterior de la sección Datos de ejemplo muestra cómo se enmascaran los datos cuando está visualizando activos de datos en catálogos, proyectos y dinámicamente antes de ejecutar trabajos de flujo de enmascaramiento. La vista previa posterior de la sección de datos de ejemplo muestra cómo se enmascaran los datos en las copias enmascaradas que se generan al ejecutar trabajos de flujo de enmascaramiento.
Vea este vídeo para ver cómo establecer opciones de enmascaramiento avanzadas y crear un activo de flujo de enmascaramiento en un proyecto.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Próximos pasos
Más información
- Enmascarar datos
- Enmascaramiento de datos con flujo de enmascaramiento
- Creación de trabajos con flujo de enmascaramiento
- Gestión de reglas de protección de datos
Tema principal: Reglas de protección de datos