Para enmascarar datos, los datos deben ajustarse a estos requisitos:
- Los datos están estructurados. Los datos deben estar en tablas relacionales o archivos CSV, Avro, datos particionados o Parquet.
- Las cabeceras de columna solo contienen caracteres alfanuméricos (a-z, A-Z, 0-9). Las cabeceras de columna no pueden contener caracteres no soportados, como caracteres de varios bytes o caracteres especiales.
Cuando elige la acción de enmascaramiento, debe especificar los criterios de enmascaramiento y el método de enmascaramiento.
Criterios de enmascaramiento
El criterio de enmascaramiento identifica las columnas a enmascarar. Seleccione el tipo de propiedad de columna y especifique uno o más valores específicos de la propiedad, que se combinarán lógicamente con el operador OR .
Tipo de propiedad de columna | Descripción | Valores específicos |
---|---|---|
Término empresarial | Término empresarial que se asigna a la columna. | Busque y seleccione uno o más términos empresariales publicados. |
Clase de datos | La clase de datos que se asigna a la columna. | Busque y seleccione una o varias clases de datos publicadas. |
Etiqueta | Etiqueta que se asigna a una columna del activo. | Especifique una o más etiquetas, separadas por comas. |
Nombre de columna | Nombre de una columna. | Especifique uno o más nombres de columna, separados por comas. |
Por ejemplo, supongamos que elige la propiedad de columna de la clase de datos y los valores específicos de la licencia de conducir del estado de California y la licencia de conducir del estado de Nevada. A continuación, los valores se enmascaran en columnas que se asignan a la clase de datos de licencia de conducir del estado de California o licencia de conducir del estado de Nevada.
Visión general de los métodos de enmascaramiento
Las principales diferencias entre los métodos de enmascaramiento son cuánto de las características originales de los datos permanecen. Cuantas más características originales de los datos queden, más útiles, pero menos seguros, son los datos enmascarados. Cuando elija un método de enmascaramiento, tenga en cuenta estos factores:
Integridad de datos: Si desea repetir el mismo valor enmascarado para un valor original repetido para mantener la integridad referencial entre las tablas.
Formato de datos: Si se debe conservar el formato de los datos originales. La conservación del formato significa que las letras se sustituyen por letras con las mismas ayúsculas y minúsculas, los dígitos se sustituyen por dígitos y el número de caracteres es el mismo.
En la tabla siguiente se describe cómo afecta a estas características cada método de enmascaramiento.
Método | Descripción | ¿Conserva la integridad? | ¿Conserva el formato de datos |
---|---|---|---|
Ocultar | De forma predeterminada, sustituye los valores por diez caracteres X. El método más seguro. También puede redactar datos utilizando opciones avanzadas de enmascaramiento. Puede personalizar el carácter de sustitución y el número de caracteres de sustitución. Para las columnas que tienen algunas clases de datos asignadas, puede elegir la sustitución parcial. |
Nee | No: Si no está utilizando opciones avanzadas de enmascaramiento. Sí: Si está utilizando opciones avanzadas de enmascaramiento. |
Sustituir | Sustituir los valores por valores generados aleatoriamente que conservan la integridad referencial. | Sí | Nee |
Oscurecer | Sustituir valores por valores que conservan la integridad referencial y el formato de datos original. El método menos seguro. | Sí | Sí |
Para los datos virtuales, el comportamiento de enmascaramiento es ligeramente diferente, en función de la definición del campo de datos. Consulte Enmascaramiento de datos virtuales.
Ocultar
Puede redactar datos utilizando dos métodos diferentes.
El método de redacción básico sustituye cada valor de datos por una serie de exactamente diez letras de X. Con los datos ocultos, el formato de los datos y la integridad de los datos no se conservan. Ocultar es el método de enmascaramiento más seguro, pero da lugar a los datos enmascarados menos útiles.
Por ejemplo, el número de teléfono 510-555-1234 se sustituye por XXXXXXXXXX. Todos los demás números de teléfono se sustituyen por el mismo valor.
Puede especificar opciones avanzadas de redacción para criterios basados en clases de datos con opciones avanzadas de enmascaramiento. A diferencia del método de redacción predeterminado, los caracteres de sustitución que se utilizan para enmascarar datos dependen de los caracteres específicos que configure para redactar los datos. También puede especificar el número de caracteres para enmascarar los datos. Con los datos redactados avanzados, el formato de los datos no se conserva, pero se conserva la integridad de los datos.
Por ejemplo, si un tipo de columna es un entero y se ha configurado 0 para redactar enteros, los datos se redactarán con 0000000000. Si un tipo de columna es una serie y X está configurado para redactar series, los datos se redactarán con XXXXXXXXXX. Si un tipo de columna está configurado para fecha y 2022-06-30 está configurado para redactar fechas, los datos se redactarán con 2022-06-30.
Sin embargo, las opciones avanzadas de enmascaramiento no se aplican automáticamente. Debe aplicarlo a los activos de datos seleccionados en un proyecto y luego publicar los activos enmascarados en un catálogo.
Sustituir
El método Sustituir sustituye los datos por valores que no coinciden con el formato original. Sin embargo, conserva la integridad referencial para los valores repetidos para todos los activos del catálogo. Los valores sustituidos no tienen sentido y el formato original de los valores no se puede determinar. El método Sustituir proporciona un nivel de seguridad y de utilidad de datos que está entre los métodos Ocultar y Oscurecer.
Por ejemplo, el número de teléfono 510-555-1234 siempre se sustituye por 500ddcc98133703531re3456
.
Oscurecer
El método Oscurecer sustituye los valores de datos por valores con formato similar que coinciden con el formato original y conserva la integridad referencial para los valores repetidos. Puesto que los valores oscurecidos tienen un formato similar, pueden ser valores válidos. Oscurecer es el método de enmascaramiento menos seguro, pero da lugar a los datos enmascarados más útiles.
Por ejemplo, el número de teléfono 510-555-1234 siempre se sustituye por 415-987-6543.
Sin embargo, el método Oscurecer se limita a los valores de datos en columnas que tienen asignadas clases de datos con los siguientes tipos de información:
- Información personal, por ejemplo, atributos básicos de un individuo, como por ejemplo el sufijo honorífico de de nombre.
- Detalles del contacto, por ejemplo, direcciones de correo electrónico, números de teléfono, estado, distrito postal, latitud o longitud.
- Cuentas financieras, por ejemplo números de tarjetas de crédito, de cuentas bancarias o de otras cuentas financieras.
- Identidades de gobierno, por ejemplo, números de identificación personal emitidos por los gobiernos, como SSN (los números de seguridad social de EE.UU.) y CCN (los números de tarjetas de crédito).
- Información demográfica personal, por ejemplo, religión, origen étnico, estado civil, aficiones o estado de empleo.
- Datos de conectividad, por ejemplo, dirección IP o dirección mac.
Si crea una regla para oscurecer datos y la regla se aplica a los datos que no tienen asignada una clase de datos que da soporte al oscurecimiento, en su lugar se utiliza el método sustituto.
Puede especificar opciones avanzadas de oscurecimiento para enmascarar criterios basados en clases de datos con el enmascaramiento de datos avanzado. Sin embargo, el enmascaramiento de datos avanzado no se aplica automáticamente. Debe aplicarlo a los activos de datos seleccionados en un proyecto y luego publicar los activos enmascarados en un catálogo.
Visualice este vídeo para ver cómo se enmascaran los datos.
Este vídeo proporciona un método visual para aprender los conceptos y tareas de esta documentación.
Más información
- Diseño de reglas de protección de datos
- Evaluación de reglas de protección de datos
- Gestión de reglas de protección de datos
- Opciones de enmascaramiento avanzadas
Tema principal: Reglas de protección de datos