Le opzioni di mascheramento avanzate estendono la capacità delle regole di protezione dei dati e delle regole di ubicazione dei dati, proteggendo i dati con tecniche di deidentificazione avanzate. Le tecniche mantengono il formato e l'integrità dei dati. Il programma di utilità high data consente agli utenti di dati, come data scientist, analisti di business e sviluppatori di applicazioni di produrre informazioni dettagliate di alta qualità da dati protetti.
Le opzioni di mascheramento avanzate includono le seguenti funzioni:
- Annullamento dell'identificazione di conservazione del formato per 165 classi di dati predefinite per gestire il programma di utilità per i progetti AI.
Le regole di protezione dei dati definite con le opzioni di mascheramento avanzate vengono applicate per IBM Data Virtualization. Le regole possono implementare il formato conservando l'offuscamento su qualsiasi classe di dati predefinita, ad eccezione di IBAN
e URL
.
- Integrità delle relazioni per proteggere i dati in modo coerente tra le origini dati correlate.
I seguenti scenari illustrano in che modo l'opzione di mascheramento avanzato estende la capacità delle regole di protezione dati.
I data scientist desiderano utilizzare i dati finanziari, come i numeri delle carte di credito e i numeri dei conti bancari nel loro modello Machine Learning per prevedere le transazioni fraudolente. I numeri di carta di credito non possono essere XXXXXXXXX per produrre i risultati che stanno cercando. Invece, hanno bisogno di numeri di carta di credito effettivi. Il metodo di conservazione del formato nelle opzioni di mascheramento avanzate produce numeri di carte di credito che soddisfano i requisiti di formattazione. I requisiti di formato includono la gestione delle informazioni sull'identificativo del problema (specificando quale società di carte di credito (Visa, Mastercard e così via) ha emesso la carta), l'algoritmo di checksum luhn e così via. Il mascheramento realistico garantisce che gli utenti dei dati possano produrre risultati precisi.
Gli utenti di dati sanitari desiderano utilizzare i dati dei pazienti che contengono il loro nome e indirizzo per analizzare i risultati degli studi clinici sulle malattie terminali. Il nome del paziente non può essere mascherato da "XXXX" per produrre i risultati che stanno cercando. Hanno invece bisogno di nomi realistici e di nomi di strade, città e paesi realistici. Di conseguenza, quando gli utenti dei dati eseguono le analisi, hanno un contesto più ampio in cui "Jane Doe", che vive al "123 Maple Lane", è la partecipante allo studio con un tumore al seno.
A causa della specificità delle opzioni di mascheramento avanzate, queste opzioni possono essere applicate a una sola classe di dati alla volta. Queste opzioni sono ottimizzate per tutte le 165 classi di dati IBM Knowledge Catalog predefinite e consigliate come le migliori opzioni di conservazione del formato per ciascuna classe di dati. Tuttavia, non possono essere applicate alle classi di dati IBM Knowledge Catalog definite in modo personalizzato.
L'opzione di mascheramento avanzato può essere abilitata solo per i metodi di mascheramento Redact e Obfuscate. Le opzioni di mascheramento avanzate si applicano alle regole utilizzando mask data in columns containing data class
. Termini di business, nomi colonna e tag non sono ancora supportati.
Creazione di regole di protezione dati con opzioni di mascheramento avanzate
Le opzioni di mascheramento avanzate sono abilitate solo per le classi dati.
Completare le condizioni e selezionare gli attributi che si desidera elaborare. Si consiglia di creare le regole in uno dei seguenti modi:
Se la classe dati contiene
__insert data class__
, mascherare i dati nelle colonne contenenti la classe dati__insert data class__
.Facoltativamente, è possibile aggiungere condizioni per proprietari di asset, termini di business, tag e così via, ma prestare attenzione a comprendere come funzionano queste risorse utente di governance. Potrebbero involontariamente perdere dati non mascherati. Consultare Gestione delle regole di protezione dati.
Mascherare i dati di input piccoli, come i valori booleani o i numeri a una cifra, potrebbe sembrare che i dati non fossero mascherati quando si esegue un lavoro di mascheramento del flusso, si esegue l'anteprima o si scaricano i dati. Tuttavia, i dati sono mascherati e il valore mascherato è uguale al valore non mascherato.
Selezionare il seguente metodo per mascherare i dati:
- Altera colonne
- Offusca colonne
Il sostituto non è supportato per il mascheramento avanzato.
Selezionare le opzioni di mascheramento nella sezione Opzioni di mascheramento avanzate. Alcune opzioni sono selezionate per impostazione predefinita. Per ulteriori informazioni, consultare Redazione del metodo dei dati e offuscamento del metodo dei dati .
Creare una regola. Consultare Dati maschera per ulteriori informazioni su come mascherare i dati negli asset.
Utilizzo delle anteprime di mascheramento
L'anteprima nella sezione Dati di esempio mostra in che modo i dati vengono mascherati quando si visualizzano gli asset di dati in cataloghi, progetti e in modo dinamico prima di eseguire i job di flusso di mascheramento. L'anteprima Dopo nella sezione Dati di esempio mostra come i dati vengono mascherati nelle copie mascherate prodotte dall'esecuzione dei lavori di flusso di mascheramento.
Guardate questo video per vedere come impostare le opzioni di mascheratura avanzate e creare una risorsa di flusso di mascheratura in un progetto.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Passi successivi
Ulteriori informazioni
- Maschera dati
- Flusso Mascheramento dei dati con mascheramento
- Creazione di lavori con flusso di mascheramento
- Gestione delle regole di protezione dati
Argomento principale: Regole di protezione dati