Pour masquer les données, les données doivent être conformes à ces exigences :
- Les données sont structurées. Les données doivent se trouver dans des tables relationnelles ou CSV, Avro, des données partitionnées ou des fichiers Parquet.
- Les en-têtes de colonne contiennent uniquement des caractères alphanumériques (a-z, A-Z, 0-9). Les en-têtes de colonne ne peuvent pas contenir de caractères non pris en charge, tels que des caractères multi-octets ou des caractères spéciaux.
Lorsque vous choisissez l'action de masquage, vous devez spécifier les critères de masquage et la méthode de masquage.
Critères de masquage
Les critères de masquage identifient les colonnes à masquer. Vous sélectionnez le type de propriété de colonne et spécifiez une ou plusieurs valeurs spécifiques de la propriété, qui sont logiquement associées à l'opérateur OU.
Type de propriété de colonne | Descriptif | Valeurs spécifiques |
---|---|---|
Terme métier | Terme métier affecté à la colonne. | Recherchez puis sélectionnez un ou plusieurs termes métier publiés. |
Classe de données | Classe de données affectée à la colonne. | Recherchez puis sélectionnez une ou plusieurs classes de données publiées. |
Balise | Balise affectée à une colonne de l'actif. | Entrez une ou plusieurs balises, séparées par des virgules. |
Nom de colonne | Nom d'une colonne. | Entrez un ou plusieurs noms de colonne, séparés par des virgules. |
Par exemple, supposons que vous choisissiez la propriété de colonne de la classe Data et les valeurs spécifiques de California State Driver's License et Nevada State Driver's License. Les valeurs sont ensuite masquées dans les colonnes qui sont attribuées soit au California State Driver's License, soit à la classe de données du Nevada State Driver.
Présentation des méthodes de masquage
Les principales différences entre les méthodes de masquage sont la quantité des caractéristiques d'origine des données qui restent. Plus les caractéristiques originales des données sont conservées, plus elles sont utiles, mais moins sécurisées, les données masquées deviennent. Lorsque vous choisissez une méthode de masquage, examinez ces facteurs :
Intégrité des données : Indique s'il faut répéter la même valeur masquée pour une valeur d'origine répétée afin de maintenir l'intégrité référentielle entre les tables.
Format de données : Indique si le Format des données d'origine doit être conservé. Préserver le format signifie que les lettres sont remplacées par des lettres avec le même cas, les chiffres sont remplacés par des chiffres, et le nombre de caractères est le même.
Le tableau suivant décrit comment chaque méthode de masquage affecte ces caractéristiques.
Méthode | Descriptif | Préserve l'intégrité ? | Le format des données de la réserve ? |
---|---|---|---|
Occulter | Par défaut, remplace les valeurs par dix caractères X. La méthode la plus sécurisée. Vous pouvez également occulter des données à l'aide des options de masquage avancées. Vous pouvez personnaliser le caractère de remplacement et le nombre de caractères de remplacement. Pour les colonnes auxquelles des classes de données sont affectées, vous pouvez choisir le remplacement partiel. |
Non | Non: si vous n'utilisez pas d'options de masquage avancées. Oui: si vous utilisez des options de masquage avancées. |
Remplacer | Remplacez les valeurs par des valeurs générées de manière aléatoire qui préservent l'intégrité référentielle. | Oui | Non |
Brouiller | Remplacez les valeurs par des valeurs qui préservent l'intégrité référentielle et le format de données d'origine. La méthode la moins sécurisée. | Oui | Oui |
Pour les données virtuelles, le comportement du masquage est légèrement différent, en fonction de la définition de la zone de données. Voir Masquage des données virtuelles.
Occulter
Vous pouvez occulter des données à l'aide de deux méthodes différentes.
La méthode d'occultation de base remplace chaque valeur de données par une chaîne de dix lettres de X exactement. Avec les données expurgées, le format des données et l'intégrité des données ne sont pas conservés. Redact est la méthode de masquage la plus sûre, mais les résultats sont les moins utiles pour les données masquées.
Par exemple, le numéro de téléphone 510-555-1234 est remplacé par XXXXXXXXXX. Tous les autres numéros de téléphone sont remplacés par la même valeur.
Vous pouvez spécifier des options d'occultation avancées pour les critères basés sur des classes de données avec des options de masquage avancées. Contrairement à la méthode d'occultation par défaut, les caractères de remplacement utilisés pour masquer les données dépendent des caractères spécifiques que vous configurez pour occulter les données. Vous pouvez également spécifier le nombre de caractères pour masquer les données. Avec les données occultées avancées, le format des données n'est pas conservé, mais l'intégrité des données est préservée.
Par exemple, si un type de colonne est un entier et que 0 est configuré pour occulter des entiers, les données sont occultées avec 0000000000. Si une colonne est de type chaîne et que X est configuré pour occulter des chaînes, les données sont occultées avec XXXXXXXXXX. Si un type de colonne est configuré pour la date et que 2022-06-30 est configuré pour les dates d'occultation, les données sont occultées avec 2022-06-30.
Toutefois, les options de masquage avancées ne sont pas appliquées automatiquement. Vous devez l'appliquer à des actifs de données sélectionnés dans un projet, puis publier les actifs masqués dans un catalogue.
Remplacer
La méthode de remplacement remplace les données par des valeurs qui ne correspondent pas au format d'origine Toutefois, elle conserve l'intégrité référentielle pour les valeurs répétées de tous les actifs du catalogue. Les valeurs substituées sont dénuées de sens et le format original des valeurs ne peut pas être déterminé. Le substituant fournit la sécurité et l'utilité des données entre les méthodes Redact et Obfuscate.
Par exemple, le numéro de téléphone 510-555-1234 est toujours remplacé par 500ddcc98133703531re3456
.
Brouiller
La méthode obfuscate remplace les valeurs de données par des valeurs formatées de la même manière qui correspondent au format d'origine et préserve l'intégrité référentielle pour les valeurs répétées. Comme les valeurs obfusquées sont formatées de manière similaire, elles peuvent être des valeurs valides. L'obscurcate est la méthode de masquage la moins sûre, mais les résultats sont les données masquées les plus utiles.
Par exemple, le numéro de téléphone 510-555-1234 est toujours remplacé par 415 -987-6543.
Toutefois, la méthode obfuscate est limitée aux valeurs de données dans les colonnes auxquelles sont affectées des classes de données avec les types d'informations suivants :
- Les informations personnelles, par exemple, les attributs de base d'un individu, tels que le suffixe honorifique ou le suffixe de nom.
- Coordonnées, par exemple adresses e-mail, numéros de téléphone, état, adresses postales, latitude ou longitude.
- Comptes financiers, par exemple, cartes de crédit, opérations bancaires ou autres numéros de compte financier.
- Identités gouvernementales, par exemple numéros d'identification personnels émis par les gouvernements, comme les numéros de sécurité sociale aux Etats-Unis (SSN) ou les numéros de carte de crédit (CCN).
- Données démographiques personnelles, par exemple, religion, appartenance ethnique, état matrimonial, passe-temps ou statut d'employé.
- Données de connectivité, par exemple, adresse IP ou adresse mac.
Si vous créez une règle pour masquer les données et que la règle est appliquée sur des données qui ne sont pas affectées d'une classe de données prenant en charge l'obscurcissement, la méthode de substitution est utilisée à la place.
Vous pouvez spécifier des options d'obfuscation avancées pour le masquage des critères basés sur des classes de données avec Masquage des données avancées. Toutefois, le masquage des données avancées n'est pas automatiquement appliqué. Vous devez l'appliquer à des actifs de données sélectionnés dans un projet, puis publier les actifs masqués dans un catalogue.
Regardez cette vidéo pour voir comment masquer des données.
Cette vidéo fournit une méthode visuelle pour apprendre les concepts et les tâches de cette documentation.
En savoir plus
- Conception de règles de protection des données
- Evaluation des règles de protection des données
- Gestion des règles de protection des données
- Options de masquage avancé
Rubrique parent : Règles de protection des données