Puede utilizar reglas de protección de datos para enmascarar datos virtuales. Cuando se consultan, las columnas enmascaradas devuelven datos encubiertos.
El enmascaramiento de datos solo se aplica a los conjuntos de resultados de las consultas. Los datos originales de tablas y columnas permanecen intactos. El enmascaramiento no se aplica a los predicados o vistas de consulta. Puede utilizar el enmascaramiento para evitar que los datos confidenciales queden expuestos. Sin embargo, el enmascaramiento de datos no impide que los usuarios Data Virtualization se conecten al servicio y ejecuten consultas sobre esos datos. Los usuarios pueden unirse y agrupar datos, generar los informes, realizar análisis y recopilar información utilizando los datos en bruto, al mismo tiempo que enmascaran el conjunto de resultados únicamente.
Las reglas de enmascaramiento de datos sólo se aplican a los siguientes objetos en Data Virtualization:
- Objetos virtualizados
- Tablas de Db2® nativas
- Tablas de consulta materializada (MQT)
En función del método de enmascaramiento de datos, los datos se redactan, se sustituyen o se oscurecen. Para obtener más información, consulte Gobernar los datos virtuales con reglas de protección de datos en Data Virtualization. Un icono de bloqueo () junto al nombre de columna en los datos virtualizados indica que los datos de la columna están enmascarados por una regla de protección de datos.
Acciones de enmascaramiento soportadas
- Redacción (Básico)
- Correlación de datos para la acción Redactar
- La siguiente lista describe qué tipos de datos se asignan para la acción Redactar en Data Virtualization.
- VARCHAR está enmascarado en la longitud de columna 'XXXXXXXXXX' o' X' *, la que sea más corta.
- CHAR está enmascarado en la longitud de columna 'XXXXXXXXXX' o' X' *, la que sea más corta.
- Los tipos de datos numéricos se enmascaran en 0.
- DATE está enmascarado en '2001-01-01'.
- TIME está enmascarado en '00:00:00'.
- TIMESTAMP se enmascara en DATE ('2001-01-01 00:00:00.0').
- BOOLEAN está redactado como "False".
- Redacción parcial (Avanzado)
- Sustitución
- Correlación de datos para la acción Sustituir
- CHAR, VARCHAR
- La acción Sustituir enmascaramiento se basa en un hash sha256 salado y cuando se utiliza con columnas CHAR/VARCHAR, se codifica en base64 . La longitud de columna debe ser como mínimo de 43 bytes para evitar colisiones (dos entradas distintas que dan como resultado la misma salida).
- SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT
- La sustitución muestra un hash numérico del valor original. Si el valor resultante tiene un "0" inicial, ese cero no se mostrará. Por ejemplo, un valor enmascarado de "02" se visualiza como "2" solamente.
- FECHA, INDICACIÓN de fecha y hora
- La sustitución muestra una representación hash del valor original.
- CLOB, BLOB, BINARY, VARBINARY
NULL
(o valor vacío si la columna se define comoNOT NULL
)- Otros datos
- Retroceden a la acción Redactar.
- Ofuscación (Básica)
- Ofuscación (Avanzado)
- Enmascaramiento reversible
- Opciones de formato de caracteres con el método Identificador
- Conservar formato
- Enmascaramiento irreversible
- Coherencia repetible
- Coherencia aleatoria
- Validación de entrada
- Método de identificador
Para las opciones de enmascaramiento y enmascaramiento avanzado, se soportan las siguientes clases de datos.
- Nombre de la persona
- Nombre
- Apellido
- Sufijo de nombre
- Tratamiento
- Género
- Dirección de correo electrónico
- Fecha de nacimiento
- Permiso de conducir
- Todos los 50 formatos de número de licencia de conducción del estado de EE.UU.
- Número de seguridad social de EE. UU.
- Últimos 4 dígitos del número de la seguridad social de EE. UU.
- Origen étnico
- Color de ojos
- Color de pelo
- Afición/actividad de ocio
- Estado civil
- Partido político
- Situación laboral
- Relación
- Religión
- Código de idioma o nombre según ISO 369
- Nombre de organización
- Identificador de negocio de Dun & Bradstreet
- Número de DUNS
- Empresa Fortune 1000
- Términos comerciales internacionales
- Código de entidad comercial y de gobierno
- Línea de dirección
- Línea 1 de dirección
- Segunda línea de la dirección
- Línea de dirección 3
- Nombre de país
- Códigos de países
- Nombre de calle de EE. UU.
- Nombre de capital de estado de EE. UU.
- Código postal de EE. UU.
- Número de teléfono de EE. UU.
- Códigos de estado de EE.UU.
- Nombres de estado de EE.UU.
- Nombres de condado de EE.UU.
- Nombre de estado/provincia
- Ciudad (inglés)
- Códigos de provincia de Canadá
- Nombres de provincia de Canadá
- Latitud
- Longitud
- ISO 3166-2 código de estado/provincia del país
- Dirección de Protocolo Internet
- Dirección de Protocolo Internet Versión 6
- Código de identificador de banco
- Número de cuenta
- Número de tarjeta de crédito
- Tarjeta de crédito Visa
- Tarjeta de crédito American Express
- Tarjeta de crédito de tarjeta maestra
- Tarjeta de crédito Discover
- Tarjeta de crédito del Club de comensales
- Tarjeta de crédito de la oficina de crédito de Japón
- Fecha
- Fecha y hora
- Mes
- Temperatura
- Número de matrícula del vehículo alemán
- Clasificación estadística internacional de enfermedades v10
Notas de uso
- El soporte de enmascaramiento de datos en Data Virtualization está limitado a los siguientes tipos de datos:
- Series de caracteres (CHAR, VARCHAR)
- Numérico (SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT)
- Fecha y hora (DATE, TIMESTAMP)
- Booleano
- Las columnas del tipo de datos TIME siempre se enmascaran como 00:00:00.000 independientemente de cómo se haya definido la regla de enmascaramiento.
- Las columnas de los tipos CLOB, BLOB, BINARY y VARBINARY se enmascaran como
NULL
(o como un valor vacío si la columna se define comoNOT NULL
) independientemente de la acción de enmascaramiento. - El enmascaramiento no se aplica a predicados de consulta como WHERE, GROUP BY, JOIN, TENER, SELECT DISTINCT y ORDER BY en una sentencia SQL.
- Para que se apliquen las reglas de enmascaramiento de datos, los objetos virtuales deben capturarse en un catálogo gobernado y utilizar el tipo de conexión Data Virtualization.
- Las reglas de enmascaramiento de datos no se pueden aplicar directamente a las vistas. Los conjuntos de resultados de las vistas se enmascaran de acuerdo con las reglas de protección de datos que se aplican a los objetos a los que hace referencia la vista. Puede enmascarar los detalles de identificación de las tablas a las que se hace referencia en la definición de vista.
- La redacción, incluida la parcial, de columnas de todos los tipos de datos numéricos dará como resultado el enmascaramiento como 0.
- Defina reglas de protección de datos utilizando la interfaz de usuario del creador de reglas. Data Virtualization admite las opciones de redacción parcial descritas en " Regulación de datos virtuales con normas de protección de datos en " Data Virtualization.
- Para asegurarse de que los resultados son correctos, utilice las asignaciones de clase de datos adecuadas para las definiciones de columna. Por ejemplo, no asigne una clase de datos Código postal a una columna de tipo DECIMAL.
- La ofuscación de clases de datos no soportadas siempre realizará el enmascaramiento de identificador, que enmascara las letras con letras y los dígitos con dígitos, y mantiene las mayúsculas y minúsculas.
- Cuando los valores
NULL
se sustituyen o se ocultan, se genera un valor aleatorio (no determinista) para las columnas con clases de datos soportadas. Los valores deNULL
en columnas con clases de datos no soportadas vuelven a la redacción estándar. - Cuando se utiliza el método de enmascaramiento Identificador con ofuscación, los valores vacíos se redactan.
- Las funciones de agregación como SUM pueden provocar un desbordamiento numérico en el enmascaramiento de sustitución. Puede convertir la columna a un tipo de grado superior tal como se muestra en el ejemplo siguiente:
SELECT SUM(CAST(VALUE AS DECIMAL(31,0))) FROM PROJECT1.CUSTOMERS
- Cuando se utiliza la opción validación de entrada en las reglas de ofuscación , cualquier valor de entrada que no sea conocido por los diccionarios internos se considerará no válido y, en su lugar, se realizará la redacción .
- La redacción ofrece el mejor rendimiento. La sustitución y la ofuscación utilizan algoritmos más avanzados, lo que resulta en una mayor sobrecarga.
- Las columnas enmascaradas no se pueden utilizar en
SELECT
(incluidas las vistas) derivadas de una operación de conjunto que implique un operador de conjuntoEXCEPT
,EXCEPT ALL
,INTERSECT
,INTERSECT ALL
oUNION
.
Limitaciones
- Importante:
' 'Cuando previsualice, descargue o refine activos de datos de Data Virtualization en servicios ' Watson distintos de Data Virtualization, en ' Cloud Pak for Data (por ejemplo, IBM Knowledge Catalog, ' Watson Studio, y ' Data Refinery), y en los casos en que se aplique el enmascaramiento de datos o el filtrado a nivel de filas, la previsualización estará sujeta únicamente a las reglas de protección de datos y al control de acceso al catálogo o al proyecto. Los controles de acceso a Data Virtualization no se aplican.
el control de acceso "Data Virtualization " no se aplica cuando el enmascaramiento de datos o el filtrado a nivel de filas se aplica a la vista previa en servicios " Watson " (distintos de " Data Virtualization). Los controles de acceso internos de " Data Virtualization ", que se controlan utilizando " Gestionar el acceso " en la interfaz de usuario de " Data Virtualization ", no se aplican a la vista previa de los otros servicios de " Watson " con enmascaramiento o filtrado a nivel de fila. Debe definir las reglas para gestionar el acceso a los catálogos, proyectos, activos de datos o conexiones para el control de acceso en los otros servicios de Watson .
- El método de enmascaramiento de identificador no está soportado en caracteres de varios bytes. Se devuelven caracteres de varios bytes originales.
- Es posible que vea resultados inesperados cuando enmascara caracteres de varios bytes mediante caracteres de un solo byte o enmascara caracteres de un solo byte con varios bytes.
- Data Virtualization no permite enmascarar las clases de datos personalizadas. En su lugar, se utiliza el método de enmascaramiento de identificador.
- Las opciones de formato de caracteres en ofuscación no están soportadas y, en su lugar, se realiza el enmascaramiento de identificador, que enmascara las letras con letras y los dígitos con dígitos, y mantiene las mayúsculas y minúsculas.
- En algunas circunstancias, la vista previa enmascarada en catálogos o proyectos puede ser diferente que en Data Virtualization.