Vous pouvez utiliser des règles de protection des données pour masquer des données virtuelles. Lorsque les colonnes masquées sont interrogées, les colonnes masquées renvoient des données masquées.
Le masquage des données s'applique uniquement aux ensembles de résultats des requêtes. Les données d'origine dans les tables et les colonnes restent intactes. Le masquage ne s'applique pas aux prédicats ou vues de requête. Vous pouvez utiliser le masquage des données pour éviter d'exposer des données sensibles. Cependant, le masquage des données n'empêche pas les utilisateurs de Data Virtualization de se connecter au service et d'exécuter des requêtes sur ces données. Les utilisateurs peuvent joindre et regrouper des données, générer les rapports, effectuer des analyses et collecter des informations à l'aide des données brutes, tout en masquant uniquement l'ensemble de résultats.
Les règles de masquage des données ne s'appliquent qu'aux objets suivants de la Data Virtualization:
- Objets virtualisés
- Tables Db2® natives
- Tables de requêtes matérialisées (MQT)
En fonction de la méthode de masquage des données, les données sont expurgées, remplacées ou brouillées. Pour plus d'informations, reportez-vous à la section Gouverner les données virtuelles à l'aide de règles de protection des données dans la section Data Virtualization. Une icône de verrouillage () en regard du nom de colonne dans vos données virtualisées indique que les données de la colonne sont masquées par une règle de protection des données.
Actions de masquage prises en charge
- Occultation (de base)
- Mappage de données de l'action Expurger
- La liste suivante décrit les types de données qui sont mappés pour l'action Redact dans la Data Virtualization.
- VARCHAR est masqué par 'XXXXXXXXXX' ou 'X' * longueur de colonne, la valeur la plus courte étant retenue.
- CHAR est masqué par 'XXXXXXXXXX' ou 'X' * longueur de colonne, la valeur la plus courte étant retenue.
- Les types de données numériques sont masqués à 0.
- DATE est masqué sur'2001-01-01'.
- HEURE est masqué à '00:00:00'.
- TIMESTAMP est masqué à DATE ('2001-01-01 00:00:00.0').
- BOOLEAN est occulté comme "False".
- Occultation partielle (avancée)
- substitution
- Mappage de données de l'action Remplacer
- CHAR, VARCHAR
- L'action de masquage de remplacement est basée sur un hachage sha256 salé et lorsqu'elle est utilisée avec des colonnes CHAR/VARCHAR, elle obtient le codage base64 . La longueur de la colonne doit être d'au moins 43 octets pour éviter les collisions (deux entrées distinctes entraînant la même sortie).
- SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT
- La substitution affiche un hachage numérique de la valeur d'origine. Si la valeur obtenue a un "0" en tête, ce zéro ne sera pas affiché. Par exemple, une valeur masquée de "02" s'affiche sous la forme "2".
- DATE, HORODATAGE
- La substitution affiche une représentation hachée de la valeur d'origine.
- CLOB, BLOB, BINARY, VARBINARY
NULL
(ou valeur vide si la colonne est définie commeNOT NULL
)- Autres données
- Revient à l'action Expurger.
- Brouillage (de base)
- Brouillage (avancé)
- Masquage réversible
- Options de formatage des caractères avec la méthode Identifier
- Conserver le format
- Masquage irréversible
- Cohérence reproductible
- Cohérence aléatoire
- Validation de l'entrée
- Méthode d'identificateur
Pour les options de brouillage et de masquage avancé, les classes de données suivantes sont prises en charge.
- Nom personne
- Prénom
- Nom
- Suffixe du nom
- Titre
- Sexe
- Adresse électronique
- Date naissance
- Permis de conduire
- Tous les 50 formats de numéro de permis de conduire aux Etats-Unis
- Numéro de sécurité sociale (Etats-Unis)
- US Social Security Number Last 4
- Ethnicity
- Couleur des yeux
- Couleur des cheveux
- Hobby/Leisure Activity
- Legal Marital/Civil Status
- Political Party
- Employment Status
- Relation
- Religion
- Code ou nom de langue selon la norme ISO 369
- Raison sociale
- Identificateur Dun & Bradstreet Business
- Numéro DUNS
- Fortune 1000 Company
- Conditions commerciales internationales
- Commercial and Government Entity Code
- Ligne d'adresse
- Ligne d'adresse 1
- Ligne d'adresse 2
- Adresse ligne 3
- Nom du pays
- Codes pays
- US Street Name
- US State Capital Name
- US ZIP Code
- Numéro de téléphone US
- Codes d'état des Etats-Unis
- Noms d'état aux Etats-Unis
- Noms de comté aux Etats-Unis
- State/Province Name
- Ville (anglais)
- Codes de province du Canada
- Nom des provinces du Canada
- Latitude
- Longitude
- Code ISO 3166-2 de l'État/province du pays
- Adresse de protocole IP
- Internet Protocol Version 6 Address
- Code d'identification de la banque
- Numéro de compte
- Numéro de carte de crédit
- Carte de crédit Visa Card
- Carte de crédit American Express
- Carte de crédit de la carte principale
- Carte de crédit carte de reconnaissance
- Carte de crédit du club des dîners
- Carte de crédit du bureau de crédit du Japon
- Date :
- Datetime
- Mois
- Température
- Numéro d'immatriculation allemand du véhicule
- Classification statistique internationale des maladies v10
Notes d'utilisation
- La prise en charge du masquage des données dans la Data Virtualization est limitée aux types de données suivants :
- Chaînes de caractères (CHAR, VARCHAR)
- Numérique (SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT)
- Date et heure (DATE, TIMESTAMP)
- Booléen
- Les colonnes du type de données TIME sont toujours masquées en tant que 00:00:00.000 , quel que soit le mode de définition de la règle de masquage.
- Les colonnes de types CLOB, BLOB, BINARY et VARBINARY sont masquées en tant que
NULL
(ou en tant que valeur vide si la colonne est définie en tant queNOT NULL
), quelle que soit l'action de masquage. - Le masquage n'est pas appliqué aux prédicats de requête tels que les clauses WHERE, GROUP BY, JOIN, AVOIR, SELECT DISTINCT et ORDER BY dans une instruction SQL.
- Pour que les règles de masquage des données s'appliquent, les objets virtuels doivent être capturés dans un catalogue gouverné et utiliser le type de connexion Data Virtualization.
- Les règles de masquage des données ne peuvent pas être appliquées directement aux vues. Les ensembles de résultats des vues sont masqués en fonction des règles de protection des données qui s'appliquent aux objets référencés par la vue. Vous pouvez masquer les détails d'identification des tables référencées dans la définition de vue.
- L'occultation, y compris partielle, des colonnes de tous les types de données numériques entraîne le masquage à 0.
- Définissez des règles de protection des données à l'aide de l'interface utilisateur du générateur de règles. La Data Virtualization prend en charge les options d'expurgation partielle décrites dans la section Gouverner les données virtuelles avec des règles de protection des données dans la Data Virtualization.
- Pour garantir des résultats corrects, utilisez les affectations de classe de données appropriées pour les définitions de colonne. Par exemple, n'affectez pas de classe de données de code postal à une colonne de type DECIMAL.
- Le brouillage des classes de données non prises en charge effectue toujours le masquage de l'identificateur, qui masque les lettres avec des lettres et les chiffres avec des chiffres, et gère la casse des lettres.
- Lorsque des valeurs
NULL
sont substituées ou brouillées, une valeur aléatoire est fabriquée (non déterministe) pour les colonnes avec des classes de données prises en charge. Les valeursNULL
dans les colonnes dont les classes de données ne sont pas prises en charge reviennent à l'occultation standard. - Lorsque la méthode de masquage d'identificateur est utilisée avec le brouillage, les valeurs vides sont occultées.
- Les fonctions d'agrégation telles que SUM peuvent provoquer un dépassement de capacité numérique dans le masquage de substitution. Vous pouvez transtyper la colonne vers un type de degré supérieur, comme illustré dans l'exemple suivant:
SELECT SUM(CAST(VALUE AS DECIMAL(31,0))) FROM PROJECT1.CUSTOMERS
- Lorsque vous utilisez l'option validation d'entrée dans les règles de brouillage , toute valeur d'entrée qui n'est pas connue des dictionnaires internes est considérée comme non valide et occultation est effectuée à la place.
- L'occultation permet d'obtenir les meilleures performances. La substitution et le brouillage utilisent des algorithmes plus avancés, ce qui entraîne une surcharge plus importante.
- Les colonnes masquées ne peuvent pas être utilisées dans
SELECT
(y compris les vues) dérivées d'une opération définie impliquant un opérateurEXCEPT
,EXCEPT ALL
,INTERSECT
,INTERSECT ALL
ouUNION
.
Limitations
- Important :
Lorsque vous prévoyez, téléchargez ou affinez des données de " Data Virtualization dans des services de " Watson autres que le " Data Virtualization, dans le " Cloud Pak for Data " (par exemple, " IBM Knowledge Catalog, " Watson Studio et " Data Refinery") et dans les cas où le masquage des données ou le filtrage au niveau des lignes s'applique, la prévisualisation est soumise aux règles de protection des données et au contrôle d'accès au catalogue ou au projet uniquement. Les contrôles d'accès à la Data Virtualization ne sont pas appliqués.
Le contrôle d'accès à la Data Virtualization n'est pas appliqué lorsque le masquage des données ou le filtrage au niveau des lignes s'applique à l'aperçu dans les services " Watson (autres que la Data Virtualization. Les contrôles d'accès internes à la Data Virtualization, qui sont contrôlés en utilisant Gérer l'accès dans l'interface utilisateur de la Data Virtualization, ne s'appliquent pas à la prévisualisation des autres services " Watson avec masquage ou filtrage au niveau de la ligne. Vous devez définir vos règles pour gérer l'accès aux catalogues, aux projets, aux actifs de données ou aux connexions pour le contrôle d'accès dans les autres services Watson .
- La méthode de masquage d'identificateur n'est pas prise en charge sur les caractères multi-octets. Les caractères multi-octets d'origine sont renvoyés.
- Vous risquez de voir des résultats inattendus lorsque vous masquez des caractères multi-octets par des caractères mono-octet ou des caractères mono-octet avec des caractères multi-octets.
- Le masquage des classes de données personnalisées n'est pas pris en charge par la Data Virtualization. La méthode de masquage des identificateurs est utilisée à la place.
- Les options de formatage des caractères dans le brouillage ne sont pas prises en charge et le masquage de l'identificateur, qui masque les lettres avec des lettres et les chiffres avec des chiffres, et gère la casse des lettres, est effectué à la place.
- Dans certaines circonstances, l'aperçu masqué dans les catalogues ou les projets peut être différent de celui de la Data Virtualization.