Das Maskieren von Daten setzt voraus, dass die Daten den folgenden Anforderungen entsprechen:
- Die Daten sind strukturiert. Die Daten müssen in relationalen Tabellen oder in partitionierten Daten, CSV-Dateien, Avro-Dateien oder Parquet-Dateien enthalten sein.
- Die Spaltenüberschriften enthalten nur alphanumerische Zeichen (a-z, A-Z, 0-9). Die Spaltenüberschriften dürfen keine nicht unterstützten Zeichen wie Mehrbytezeichen oder Sonderzeichen enthalten.
Bei der Auswahl der Maskierungsaktion müssen Sie die Maskierungskriterien und die Maskierungsmethode angeben.
Maskierungskriterien
Die Maskierungskriterien geben die zu maskierenden Spalten an. Sie wählen den Typ der Spalteneigenschaft aus und geben einen Eigenschaftswert oder mehrere Werte der Eigenschaft an, die logisch mit dem Operator OR kombiniert werden.
Typ der Spalteneigenschaft | Beschreibung | Spezifische Werte |
---|---|---|
Geschäftsbegriff | Ein Geschäftsbegriff, der der Spalte zugeordnet ist | Suchen Sie nach veröffentlichten Geschäftsbegriffen und wählen Sie dann die gewünschten Begriffe aus. |
Datenklasse | Die Datenklasse, die der Spalte zugeordnet ist. | Suchen Sie nach veröffentlichten Datenklassen und wählen Sie dann die gewünschten Klassen aus. |
Tag | Ein Tag, der einer Spalte im Asset zugeordnet ist. | Geben Sie einen Tag oder mehrere durch Kommas getrennte Tags ein. |
Spaltenname | Der Name einer Spalte. | Geben Sie einen Spaltennamen oder mehrere durch Kommas getrennte Spaltennamen ein. |
Angenommen beispielsweise, Sie wählen die Spalteneigenschaft 'Datenklasse' und als spezifische Werte eine in Kalifornien erworbene Fahrerlaubnis und eine in Nevada erworbene Fahrerlaubnis aus. Anschließend werden Werte in Spalten maskiert, denen entweder die Datenklasse für die in Kalifornien erworbene Fahrerlaubnis oder die Datenklasse für die in Nevada erworbene Fahrerlaubnis zugeordnet ist.
Übersicht über Maskierungsmethoden
Die Hauptunterschiede zwischen den Maskierungsmethoden bestehen darin, wie viele der ursprünglichen Merkmale der Daten erhalten bleiben. Je umfangreicher die ursprünglichen Merkmale der Daten sind, die erhalten bleiben, desto brauchbarer, aber auch weniger geschützt sind die maskierten Daten. Berücksichtigen Sie bei der Auswahl der Maskierungsmethode die folgenden Faktoren:
Datenintegrität: Gibt an, ob derselbe maskierte Wert für einen wiederholten ursprünglichen Wert wiederholt werden soll, um die referenzielle Integrität zwischen Tabellen beizubehalten.
Datenformat: Gibt an, ob das Format der ursprünglichen Daten beibehalten werden soll. Das Beibehalten des Formats bedeutet, dass Buchstaben durch Buchstaben mit derselben Groß-/Kleinschreibung und Ziffern durch Ziffern ersetzt werden und die Anzahl der Zeichen nicht verändert wird.
Die folgende Tabelle beschreibt, wie sich die einzelnen Maskierungsmethoden auf die jeweiligen Merkmale auswirken.
Methode | Beschreibung | Integrität wird beibehalten? | Datenformat wird beibehalten? |
---|---|---|---|
Redact | Ersetzt Werte standardmäßig durch zehn X-Zeichen. Die sicherste Methode. Sie können Daten auch mithilfe von erweiterten Maskierungsoptionenneu bearbeiten. Sie können das Ersatzzeichen und die Anzahl der Ersatzzeichen anpassen. Für Spalten mit einigen zugeordneten Datenklassen können Sie eine teilweise Ersetzung auswählen. |
Nein | Nein: Wenn Sie keine erweiterten Maskierungsoptionen verwenden. Ja: Wenn Sie erweiterte Maskierungsoptionen verwenden. |
Ersetzen | Werte durch zufällig generierte Werte ersetzen, die die referenzielle Integrität wahren. | Ja | Nein |
Verschleiern | Werte durch Werte ersetzen, durch die die referenzielle Integrität gewahrt bleibt und das ursprüngliche Datenformat beibehalten wird. Die Methode mit der geringsten Sicherheit. | Ja | Ja |
Bei virtuellen Daten unterscheidet sich das Maskierungsverhalten je nach Datenfelddefinition geringfügig. Weitere Informationen finden Sie unter Virtuelle Daten maskieren.
Redigieren
Sie können Daten mit zwei verschiedenen Methoden neu bearbeiten.
Die grundlegende Neubearbeitungsmethode ersetzt jeden Datenwert durch eine Zeichenfolge mit genau zehn Buchstaben von X. Bei unkenntlich gemachten Daten wird das Format der Daten nicht beibehalten und die Datenintegrität bleibt nicht gewahrt. Das Unkenntlichmachen ist die sicherste Maskierungsmethode, führt jedoch zu den am wenigsten brauchbaren maskierten Daten.
Die Telefonnummer 510-555-1234 wird beispielsweise durch XXXXXXXXXX ersetzt. Alle anderen Telefonnummern werden durch denselben Wert ersetzt.
Mit erweiterten Maskierungsoptionenkönnen Sie erweiterte Schwärzungsoptionen für Kriterien angeben, die auf Datenklassen basieren. Im Gegensatz zur Standardschwärzungsmethode hängen die Ersatzzeichen, die zum Maskieren von Daten verwendet werden, von den spezifischen Zeichen ab, die Sie zum Schwärzen der Daten konfigurieren. Sie können auch die Anzahl der Zeichen zum Maskieren der Daten angeben. Bei erweiterten geschwärzten Daten wird das Format der Daten nicht beibehalten, aber die Datenintegrität wird beibehalten.
Wenn ein Spaltentyp beispielsweise eine ganze Zahl ist und 0 für die Neubearbeitung von Ganzzahlen konfiguriert ist, werden die Daten mit 0000000000 neu bearbeitet. Wenn ein Spaltentyp eine Zeichenfolge ist und X für die Neubearbeitung von Zeichenfolgen konfiguriert ist, werden die Daten mit XXXXXXXXXX neu bearbeitet. Wenn ein Spaltentyp für das Datum und 2022-06-30 für das Neubearbeitungsdatum konfiguriert ist, werden die Daten mit 2022-06-30 neu bearbeitet.
Erweiterte Maskierungsoptionen werden jedoch nicht automatisch umgesetzt. Sie müssen sie auf ausgewählte Datenassets in einem Projekt anwenden und die maskierten Assets anschließend in einem Katalog veröffentlichen.
Ersetzen
Beim Ersetzen werden Daten durch Werte ersetzt, die nicht dem ursprünglichen Format entsprechen. Bei dieser Methode bleibt die referenzielle Integrität in Bezug auf wiederholte Werte für alle Assets im Katalog gewahrt. Die ersetzten Werte haben keine Bedeutung und das ursprüngliche Format der Werte kann nicht ermittelt werden. In Bezug auf Sicherheit und Brauchbarkeit der Daten liegt die Methode 'Ersetzen' zwischen den Methoden 'Unkenntlichmachen' und 'Verschleiern'.
Die Telefonnummer 510-555-1234 wird beispielsweise immer durch 500ddcc98133703531re3456
ersetzt.
Verschleiern
Bei der Verschleierungsmethode werden die Datenwerte durch ähnlich formatierte Werte ersetzt, die dem ursprünglichen Format entsprechen, und die referenzielle Integrität in Bezug auf wiederholte Werte wird beibehalten. Da die verschlüsselten Werte ähnlich formatiert sind, können sie gültige Werte darstellen. Das Verschleiern stellt die am wenigsten sichere Maskierungsmethode dar, liefert jedoch die brauchbarsten maskierten Daten.
Die Telefonnummer 510-555-1234 wird beispielsweise immer durch 415-987-6543 ersetzt.
Die Verschlüsselungsmethode ist jedoch nur für Datenwerte in Spalten geeignet, denen Datenklassen mit den folgenden Informationstypen zugeordnet sind:
- Personenbezogene Daten, z. B. Grundmerkmale einer Person, wie z. B. Ehrentitel oder Namenssuffixe.
- Kontaktangaben, z. B. E-Mail-Adressen, Telefonnummern, Bundesstaat/-land, Postanschriften, Breitengrad oder Längengrad.
- Finanzkonten, z. B. Kreditkarten, Bankkontonummern oder andere Finanzkontonummern.
- Government Identities (von Behörden ausgegebene Identifikationen), zum Beispiel persönliche Identifikationsnummern, die von Behörden oder anderen offiziellen Institutionen ausgestellt werden, wie eine SSN (US-amerikanische Sozialversicherungsnummer) und eine CCN (Kreditkartennummer).
- Personenbezogene demografische Informationen, z. B. Religion, ethnische Zugehörigkeit, Familienstand, Hobbys oder Mitarbeiterstatus.
- Konnektivitätsdaten, z. B. IP-Adresse oder MAC-Adresse.
Wenn Sie eine Regel zum Verschleiern von Daten erstellen und die Regel für Daten durchgesetzt wird, denen keine Datenklasse zugeordnet ist, die die Verschleierung unterstützt, wird stattdessen die Methode 'Ersetzen' verwendet.
Sie können erweiterte Verschleierungsoptionen für Maskierungskriterien angeben, die auf Datenklassen mit erweiterter Datenmaskierung basieren. Die erweiterte Datenmaskierung wird jedoch nicht automatisch durchgesetzt. Sie müssen sie auf ausgewählte Datenassets in einem Projekt anwenden und die maskierten Assets anschließend in einem Katalog veröffentlichen.
In diesem Video erfahren Sie, wie Sie Daten maskieren.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Weitere Informationen
- Datenschutzregeln entwerfen
- Bewertung durch Datenschutzregeln
- Datenschutzregeln verwalten
- Erweiterte Maskierungsoptionen
Übergeordnetes Thema: Datenschutzregeln