Per mascherare i dati, questi devono essere conformi ai seguenti requisiti:
- I dati sono strutturati. I dati devono essere in tabelle relazionali o file CSV, Avro, dati partizionati o Parquet.
- Le intestazioni di colonna contengono solo caratteri alfanumerici (a-z, A-Z, 0-9). Le intestazioni di colonna non possono contenere caratteri non supportati, ad esempio caratteri a più byte o caratteri speciali.
Quando si sceglie l'azione di mascheramento, è necessario specificare i criteri di mascheratura e il metodo di mascheramento.
Criteri di mascheramento
Il criterio di mascheramento identifica le colonne da mascherare. Selezionare il tipo di proprietà della colonna e specificare uno o più valori specifici della proprietà, che vengono combinati logicamente con l'operatore OR .
Tipo di proprietà della colonna | Descrizione | Valori specifici |
---|---|---|
Termine di business | Un termine di business assegnato alla colonna. | Ricercare e selezionare uno o più termini di business pubblicati. |
Classe dati | La classe dati assegnata alla colonna. | Ricercare e selezionare una o più classi di dati pubblicate. |
Tag | Un tag assegnato a una colonna nell'asset. | Immettere uno o più tag, separati da virgole. |
Nome colonna | Il nome di una colonna. | Immettere uno o più nomi colonna, separati da virgole. |
Ad esempio, si supponga di scegliere la proprietà della colonna della classe Data e i valori specifici di California State Driver's License e Nevada State Driver's License. I valori vengono quindi mascherati in colonne a cui viene assegnata la California State Driver's License o la Nevada State Driver's License.
Panoramica sui metodi di mascheramento
Le principali differenze tra i metodi di mascheramento sono la quantità di caratteristiche originali dei dati che rimangono. Le caratteristiche più originali dei dati che vengono conservati, più utili, ma meno sicuri, diventano i dati mascherati. Quando si sceglie un metodo di mascheramento, considerare questi fattori:
Integrità dati: indica se ripetere lo stesso valore mascherato per un valore originale ripetuto per mantenere l'integrità referenziale tra le tabelle.
Formato dati: indica se conservare il formato dei dati originali. Preservare il formato significa che le lettere vengono sostituite da lettere con lo stesso maiuscolo / minuscolo, le cifre vengono sostituite da cifre e il numero di caratteri è lo stesso.
La seguente tabella descrive come ciascun metodo di mascheramento influisce su queste caratteristiche.
Metodo | Descrizione | Conserva l'integrità? | Conserva il formato dei dati? |
---|---|---|---|
Altera | Per impostazione predefinita, sostituisce i valori con dieci caratteri X. Il metodo più sicuro. È anche possibile revisionare i dati utilizzando opzioni di mascheramento avanzate. È possibile personalizzare il carattere di sostituzione e il numero di caratteri di sostituzione. Per le colonne che hanno alcune classi di dati assegnate, è possibile scegliere la sostituzione parziale. |
N | No: se non si utilizzano le opzioni di mascheramento avanzate. Sì: se si utilizzano le opzioni di mascheramento avanzate. |
Sostituisci | Sostituire i valori con valori generati casualmente che preservino l'integrità referenziale. | Sì | N |
Offusca | Sostituire i valori con valori che preservino l'integrità referenziale e il formato dati originale. Il metodo meno sicuro. | Sì | Sì |
Per i dati virtuali, il comportamento di mascheramento è leggermente diverso, in base alla definizione del campo dati. Vedi Maschiamento dei dati virtuali.
Altera
È possibile revisionare i dati utilizzando due diversi metodi.
Il metodo redact di base sostituisce ogni valore di dati con una stringa di esattamente dieci lettere di X. Con i dati redatti, il formato dei dati e l'integrità dei dati non vengono conservati. Redact è il metodo di mascheramento più sicuro, ma risulta nei dati mascherati meno utili.
Ad esempio, il numero di telefono 510-555-1234 viene sostituito con XXXXXXXXXX. Tutti gli altri numeri telefonici vengono sostituiti con lo stesso valore.
È possibile specificare le opzioni di redazione avanzate per i criteri basati sulle classi di dati con opzioni di mascheramento avanzate. A differenza del metodo redact predefinito, i caratteri di sostituzione utilizzati per mascherare i dati dipendono dai caratteri specifici configurati per revisionare i dati. È anche possibile specificare il numero di caratteri per mascherare i dati. Con i dati redatti avanzati, il formato dei dati non viene conservato, ma l'integrità dei dati viene preservata.
Ad esempio, se un tipo di colonna è un numero intero e 0 è configurato per la redazione di numeri interi, i dati vengono redatti con 0000000000. Se un tipo di colonna è una stringa e X è configurato per la redazione di stringhe, i dati vengono redatti con XXXXXXXXXX. Se un tipo di colonna è configurato per la data e 2022-06-30 è configurato per le date di revisione, i dati sono redatti con 2022-06-30.
Tuttavia, le opzioni di mascheramento avanzate non vengono applicate automaticamente. È necessario applicarlo agli asset di dati selezionati in un progetto e quindi pubblicare gli asset mascherati in un catalogo.
Sostituisci
Il metodo di sostituzione sostituisce i dati con valori che non corrispondono al formato originale. Tuttavia, conserva l'integrità referenziale per i valori ripetuti per tutti gli asset nel catalogo. I valori sostituiti sono privi di significato e il formato originale dei valori non può essere determinato. Il sostituto fornisce la sicurezza e l'utilità dei dati tra i metodi Redact e Obfuscate.
Ad esempio, il numero di telefono 510-555-1234 viene sempre sostituito con 500ddcc98133703531re3456
.
Offusca
Il metodo di offuscamento sostituisce i valori dei dati con valori formattati in modo simile che corrispondono al formato originale e conserva l'integrità referenziale per i valori ripetuti. Poiché i valori offuscati sono formattati in modo simile, possono essere valori validi. L'offuscamento è il metodo di mascheramento meno sicuro, ma risulta nei dati mascherati più utili.
Ad esempio, il numero di telefono 510-555-1234 viene sempre sostituito con 415 -987-6543.
Tuttavia, il metodo di offuscamento è limitato ai valori dei dati nelle colonne che hanno assegnato classi di dati con i seguenti tipi di informazioni:
- Le informazioni personali, ad esempio, gli attributi di base di un individuo, come il suffisso onorifico o del nome.
- Dettagli di contatto, ad esempio, indirizzi email, numeri di telefono, stato, indirizzi postali, latitudine o longitudine.
- Conti finanziari, ad esempio, carte di credito, banche o altri numeri di conto finanziario.
- Identità del governo, ad esempio, i numeri di identificazione personale emessi dai governi, come SSN (numeri di previdenza sociale degli Stati Uniti) e CCN (numeri di carta di credito).
- Informazioni demografiche personali, ad esempio, religione, etnia, stato civile, hobby o stato del dipendente.
- Dati di connettività, ad esempio, indirizzo IP o indirizzo mac.
Se si crea una regola per offuscare i dati e la regola viene applicata ai dati a cui non è assegnata una classe di dati che supporta l'offuscamento, viene utilizzato il metodo di sostituzione.
È possibile specificare opzioni di offuscamento avanzate per i criteri di mascheramento basati su classi di dati con mascheramento dati avanzato. Tuttavia, il mascheramento dati avanzato non viene applicato automaticamente. È necessario applicarlo agli asset di dati selezionati in un progetto e quindi pubblicare gli asset mascherati in un catalogo.
Guarda questo video per vedere come mascherare i dati.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.
Ulteriori informazioni
- Progettazione di regole di protezione dati
- Valutazione delle regole di protezione dati
- Gestione delle regole di protezione dati
- Opzioni di mascheramento avanzate
Argomento principale: Regole di protezione dati