Puede seleccionar filtrar filas como la acción en las reglas de protección de datos. Puede incluir o excluir filas basadas en valores de una columna especificada en el mismo activo o en un activo de referencia. Para seleccionar un activo de referencia, puede elegir cualquier activo de datos que tenga permiso para ver desde cualquier catálogo en el que sea colaborador.
Para IBM Data Virtualization, el filtrado de filas puede basarse en columnas de cualquier tipo de datos. El valor de filtro debe ser válido para el tipo de datos de columna al que se aplica. Por ejemplo, no puede definir una regla como, por ejemplo, incluir filas donde CREDIT_SCORE = 'ABC'
si CREDIT_SCORE
es una columna entera . Puesto que ABC
es un valor de filtro de serie , pero la columna es de tipo entero, las consultas con dicho filtro de fila dan como resultado un error.
Métodos de filtrado de filas
Cuando crea una regla de protección de datos, puede seleccionar Filtrar filas en la lista de acciones y, a continuación, especificar el método de filtro.
Por ejemplo, supongamos que tiene una base de datos con tablas que combinan datos de clientes gubernamentales, empresariales y minoristas. La tabla Facturación tiene datos para todos los tipos de clientes y una columna CustomerType que indica el tipo de cliente. Puede crear una regla de protección de datos que excluya todas las filas para los clientes gubernamentales. Puede crear una regla que excluya todas las filas si el valor de la columna CustomerType es government
, o crear una regla que incluya sólo las filas en las que el valor de la columna CustomerType sea igual a enterprise
o retail
.
Ahora supongamos que la tabla Facturación no incluye una columna CustomerType , pero sí incluye una columna CustomerID . Tiene otra tabla, CustomerInfo, que contiene las columnas CustomerID y CustomerType. Puede crear una regla de protección de datos que una las tablas Billing y CustomerInfo y filtre las filas basándose en los valores de CustomerType.
Método de filtro | Descripción | Ejemplo |
---|---|---|
Incluir filas | Incluir sólo las filas que se ajustan a los criterios de los valores especificados en la columna especificada del activo. | Incluir filas si la columna CustomerType tiene valores iguales a enterprise o retail . |
Excluir filas | Excluir las filas que se ajustan a los criterios de los valores especificados en la columna especificada del activo. | Excluir filas si la columna CustomerType tiene valores que son iguales a government . |
Incluir filas basadas en activo de referencia | Incluir sólo las filas que se ajustan a los criterios de los valores especificados en la columna especificada del activo de referencia. | Incluir filas si los valores de la columna CustomerID coinciden con los valores de la columna CustomerID del activo de datos de referencia para las filas en las que la columna CustomerType tiene valores que son iguales a enterprise o retail . |
Excluir filas basadas en activo de referencia | Excluir las filas que se ajustan a los criterios de los valores especificados en la columna especificada del activo de referencia. | Excluir filas si los valores de la columna CustomerID coinciden con los valores de la columna CustomerID del activo de datos de referencia para las filas en las que la columna CustomerType tiene valores que son iguales a government . |
Condiciones de filtrado de filas
Las condiciones de filtrado de filas especifican la columna y los valores a filtrar.
Si elige el método Incluir filas o Excluir filas , seleccione un nombre de columna, seleccione un operador y especifique un nombre de columna. Los operadores disponibles incluyen igual a, mayor que, menor que, mayor que igual a (mayor que o igual a) o menor que igual a (menor que o igual a). Puede añadir más condiciones.
Si elige el método Incluir filas basadas en activo de referencia o Excluir filas basadas en activo de referencia , seleccione el activo de referencia y, a continuación, haga coincidir la columna del activo de referencia con la columna del activo de destino. A continuación, especifique un nombre de columna en el activo de referencia por el que filtrar, seleccione un operador y especifique un nombre de columna. Los operadores disponibles incluyen igual a, mayor que, menor que, mayor que igual a (mayor que o igual a) o menor que igual a (menor que o igual a). Puede añadir más condiciones.
Directrices de valor
- Los valores que incluyen sólo números se procesan como un tipo de datos numérico.
- Los valores que incluyen sólo números entre comillas simples se procesan como un tipo de datos de serie.
- Los valores que incluyen caracteres que no son números se procesan como un tipo de datos de serie.
- Los comodines no están soportados. Debe incluir valores reales.
- Los valores son sensibles a
las mayúsculas y minúsculas. Por ejemplo, si crea una regla para filtrar filas basándose en el valor de
government
, la regla no filtra filas con el valor deGovernment
.
Directrices de activos de referencia
- El activo de datos de referencia debe tener una columna con algunos de los mismos valores que la columna coincidente especificada en los activos de datos de destino o la regla no se aplica.
- Si el activo de datos de referencia está en un catálogo diferente del activo de destino, la vista previa del activo de destino no se puede ver y el activo no se puede descargar.
- Si el activo de datos de referencia hace referencia a un activo de conexión diferente del activo de destino, la vista previa del activo de destino no se puede ver y el activo no se puede descargar.
- Para activos de datos Apache Hive , el activo de referencia debe pertenecer a la misma base de datos que el activo de datos de origen.
Limitaciones para filtrar filas
El filtrado de filas ejecuta una sentencia SQL para imponer la regla en el activo de datos de destino. La sentencia SQL se ejecuta exactamente como está codificada. La única forma de saber si la regla funciona como se esperaba es examinar el esquema de los activos de datos en catálogos gobernados que tienen criterios coincidentes. Los activos de datos con columnas que tienen valores similares pero nombres de columna diferentes no se ven afectados. Por ejemplo, si la regla especifica un nombre de columna CustomerID, la regla no afecta a los activos con el nombre de columna CustomerIdentifier. Es posible que no reciba ninguna indicación directa de una regla que no se ha desencadenado debido a que faltan criterios de filtro o no son correctos, sin embargo, los administradores pueden inspeccionar el registro de imposición de políticas para ver dichas situaciones. La calidad de los datos también debe ser alta. Los valores de los que depende la regla de protección de datos con filtrado de filas deben ser coherentes. Por ejemplo, si government
está mal escrito como goverment
o escrito como Government
, esa fila no se filtra.
Si los criterios de filtrado incluyen un activo de datos de referencia, el acceso a los datos puede encontrar retardos de rendimiento inherentes a la unión. Por ejemplo, la falta de indexación adecuada o errores de SQL debido a que falta un objeto de unión puede provocar retrasos.
Es posible que las vistas previas y descargas no estén disponibles
No puede obtener una vista previa o descargar un activo afectado por las reglas de protección de datos que filtran filas en las situaciones siguientes:
- El activo de datos se ve afectado por más de una regla de protección de datos que filtra filas por más de un activo de referencia.
- El activo de datos se ve afectado por una regla de protección de datos que filtra filas por un activo de referencia que no está en el mismo catálogo que el activo de datos de origen.
- El activo de datos se ve afectado por una regla de protección de datos que filtra filas por un activo de referencia que no utiliza la misma conexión que el activo de datos de origen.
Más información
Tema padre: Diseño de reglas de protección de datos