Erweiterte Maskierungsoptionen erweitern die Funktionalität von Datenschutzregeln und Datenpositionsregeln, indem sie die Daten mit erweiterten Desidentifikationsverfahren schützen. Die Verfahren behalten das Format und die Integrität der Daten bei. Durch die hohe Nutzbarkeit der Daten können Datenbenutzer, wie z. B. Datenwissenschaftler, Geschäftsanalysten und Anwendungsentwickler, hochwertige Erkenntnisse aus geschützten Daten ziehen.
Erweiterte Maskierungsoptionen umfassen die folgenden Funktionen:
- Eine das Format beibehaltende Anonymisierung für 165 vordefinierte Datenklassen, um das Dienstprogramm für AI-Projekte zu verwalten.
Datenschutzregeln, die mit erweiterten Maskierungsoptionen definiert sind, werden für IBM Data Virtualization durchgesetzt. Regeln können die Formatkonservierung für jede der vordefinierten Datenklassen mit Ausnahme von IBAN
und URL
implementieren.
- Beziehungsintegrität zum konsistenten Schutz von Daten in allen zugehörigen Datenquellen.
Die folgenden Szenarios erläutern, wie die erweiterte Maskierungsoption die Funktionalität von Datenschutzregeln erweitert.
Data-Scientists wollen Finanzdaten wie Kreditkartennummern und Bankkontonummern in ihrem Machine Learning-Modell nutzen, um betrügerische Transaktionen vorherzusagen. Die Kreditkartennummern dürfen nicht XXXXXXXXX sein, weil hierdurch die gewünschten Ergebnisse nicht erzeugt werden. Anstelle dessen müssen sie tatsächliche Kreditkartennummern sein. Die Methode zur Beibehaltung des Formats in erweiterten Maskierungsoptionen erzeugt Kreditkartennummern, die den Formatanforderungen entsprechen. Zu den Formatanforderungen gehören die Verwaltung der Informationen zur Kennnummer der ausgebenden Einrichtung (die Angabe, welche Kreditkartenfirma (Visa, Mastercard und so weiter) die Karte ausgestellt hat), der Luhn-Kontrollsummenalgorithmus usw. Eine realistische Maskierung stellt sicher, dass Datennutzer genaue Ergebnisse liefern können.
Benutzer von Gesundheitsdaten möchten mithilfe von Patientendaten mit den Namen und Adressinformationen der Patienten die Ergebnisse aus klinischen Studien zu unheilbaren Erkrankungen analysieren. Der Name des Patienten kann nicht mit "XXXX" maskiert werden, um die von ihnen gewünschten Ergebnisse zu erzielen. Stattdessen brauchen sie realistische Namen und realistische Straßennamen, Städte und Länder. Als Ergebnis entnehmen Datennutzer beim Durchführen der Analyse einem umfassenderen Kontext, dass 'Jane Doe', die in der '123 Maple Lane' lebt, die Studienteilnehmerin mit Brustkrebs ist.
Aufgrund der Spezifität der erweiterten Maskierungsoptionen können diese Optionen nur auf jeweils eine Datenklasse angewendet werden. Diese Optionen sind für alle 165 vordefinierten IBM Knowledge Catalog -Datenklassen optimiert und werden als beste Optionen zur Beibehaltung des Formats für jede Datenklasse empfohlen. Sie können jedoch nicht auf benutzerdefinierte IBM Knowledge Catalog -Datenklassen angewendet werden.
Die Option für die erweiterte Maskierung kann nur für die Maskierungsmethoden 'Redigieren' und 'Verschleiern' aktiviert werden. Erweiterte Maskierungsoptionen gelten für Regeln mit mask data in columns containing data class
. Geschäftsbegriffe, Spaltennamen und Tags werden noch nicht unterstützt.
Datenschutzregeln mit erweiterten Maskierungsoptionen erstellen
Erweiterte Maskierungsoptionen sind nur für Datenklassen aktiviert.
Definieren Sie die Bedingungen und wählen Sie die Attribute aus, die Sie verarbeiten möchten. Die empfohlene Vorgehensweise besteht darin, Regeln auf eine der folgenden Arten zu erstellen:
Wenn die Datenklasse
__insert data class__
enthält, maskieren Sie Daten in Spalten mit der Datenklasse__insert data class__
.Sie können optional Bedingungen für Asseteigner, Geschäftsbegriffe, Tags usw. hinzufügen. Achten Sie dabei jedoch auf die Funktionsweise dieser Governance-Artefakte. Diese könnten ungewollt unmaskierte Daten offenlegen. Siehe Datenschutzregeln verwalten.
Das Maskieren von Eingabedaten, die klein sind, wie z. B. boolesche Werte oder einstellige Zahlen, könnte so aussehen, als wären die Daten nicht maskiert, wenn Sie einen Maskierungsablaufjob ausführen, eine Vorschau der Daten anzeigen oder die Daten herunterladen. Die Daten werden jedoch maskiert und der maskierte Wert ist mit dem nicht maskierten Wert identisch.
Wählen Sie die folgende Methode zum Maskieren von Daten aus:
- Spalten redigieren
- Spalten unkenntlich machen
Die Option 'Ersetzen' wird für erweiterte Maskierung nicht unterstützt.
Wählen Sie Ihre Maskierungsoptionen im Abschnitt "Erweiterte Maskierungsoptionen" aus. Einige Optionen sind standardmäßig für Sie ausgewählt. Weitere Informationen finden Sie unter Methode der Datenredigierung und Methode der Datenverschleierung.
Regel erstellen. Weitere Informationen zum Maskieren von Daten in Assets finden Sie unter Daten maskieren .
Vorschau für Maskierungen verwenden
In der Vorabvorschau im Abschnitt "Beispieldaten" wird angezeigt, wie die Daten maskiert werden, wenn Sie Datenassets in Katalogen, Projekten und dynamisch anzeigen, bevor Sie Maskierungsablaufjobs ausführen. In der Nachvorschau im Abschnitt "Beispieldaten" wird angezeigt, wie die Daten in den maskierten Kopien maskiert werden, die durch die Ausführung von Maskierungsablaufjobs erzeugt werden.
In diesem Video erfahren Sie, wie Sie erweiterte Maskierungsoptionen festlegen und ein Maskierungsablaufasset in einem Projekt erstellen.
Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.
Nächste Schritte
Weitere Informationen
- Daten maskieren
- Daten mit Maskierungsablauf maskieren
- Jobs mit Maskierungsablauf erstellen
- Datenschutzregeln verwalten
Übergeordnetes Thema: Datenschutzregeln