0 / 0
Torna alla versione inglese della documentazione
Mascherare i dati con le regole di protezione dei datiIBM Knowledge Catalog)
Ultimo aggiornamento: 07 ott 2024
Mascherare i dati con le regole di protezione dei datiIBM Knowledge Catalog)

Per mascherare i dati, questi devono essere conformi ai seguenti requisiti:

  • I dati sono strutturati. I dati devono essere in tabelle relazionali o file CSV, Avro, dati partizionati o Parquet.
  • Le intestazioni di colonna contengono solo caratteri alfanumerici (a-z, A-Z, 0-9). Le intestazioni di colonna non possono contenere caratteri non supportati, ad esempio caratteri a più byte o caratteri speciali.

Quando si sceglie l'azione di mascheramento, è necessario specificare i criteri di mascheratura e il metodo di mascheramento.

Criteri di mascheramento

Il criterio di mascheramento identifica le colonne da mascherare. Selezionare il tipo di proprietà della colonna e specificare uno o più valori specifici della proprietà, che vengono combinati logicamente con l'operatore OR .

Tipo di proprietà della colonna Descrizione Valori specifici
Termine di business Un termine di business assegnato alla colonna. Ricercare e selezionare uno o più termini di business pubblicati.
Classe dati La classe dati assegnata alla colonna. Ricercare e selezionare una o più classi di dati pubblicate.
Tag Un tag assegnato a una colonna nell'asset. Immettere uno o più tag, separati da virgole.
Nome colonna Il nome di una colonna. Immettere uno o più nomi colonna, separati da virgole.

Ad esempio, si supponga di scegliere la proprietà della colonna della classe Data e i valori specifici di California State Driver's License e Nevada State Driver's License. I valori vengono quindi mascherati in colonne a cui viene assegnata la California State Driver's License o la Nevada State Driver's License.

Panoramica sui metodi di mascheramento

Le principali differenze tra i metodi di mascheramento sono la quantità di caratteristiche originali dei dati che rimangono. Le caratteristiche più originali dei dati che vengono conservati, più utili, ma meno sicuri, diventano i dati mascherati. Quando si sceglie un metodo di mascheramento, considerare questi fattori:

  • Integrità dati: indica se ripetere lo stesso valore mascherato per un valore originale ripetuto per mantenere l'integrità referenziale tra le tabelle.

  • Formato dati: indica se conservare il formato dei dati originali. Preservare il formato significa che le lettere vengono sostituite da lettere con lo stesso maiuscolo / minuscolo, le cifre vengono sostituite da cifre e il numero di caratteri è lo stesso.

La seguente tabella descrive come ciascun metodo di mascheramento influisce su queste caratteristiche.

Metodo Descrizione Conserva l'integrità? Conserva il formato dei dati?
Altera Per impostazione predefinita, sostituisce i valori con dieci caratteri X. Il metodo più sicuro.
È anche possibile revisionare i dati utilizzando opzioni di mascheramento avanzate. È possibile personalizzare il carattere di sostituzione e il numero di caratteri di sostituzione. Per le colonne che hanno alcune classi di dati assegnate, è possibile scegliere la sostituzione parziale.
N No: se non si utilizzano le opzioni di mascheramento avanzate.
Sì: se si utilizzano le opzioni di mascheramento avanzate.
Sostituisci Sostituire i valori con valori generati casualmente che preservino l'integrità referenziale. N
Offusca Sostituire i valori con valori che preservino l'integrità referenziale e il formato dati originale. Il metodo meno sicuro.

Per i dati virtuali, il comportamento di mascheramento è leggermente diverso, in base alla definizione del campo dati. Vedi Maschiamento dei dati virtuali.

Altera

È possibile revisionare i dati utilizzando due diversi metodi.

  • Il metodo redact di base sostituisce ogni valore di dati con una stringa di esattamente dieci lettere di X. Con i dati redatti, il formato dei dati e l'integrità dei dati non vengono conservati. Redact è il metodo di mascheramento più sicuro, ma risulta nei dati mascherati meno utili.

    Ad esempio, il numero di telefono 510-555-1234 viene sostituito con XXXXXXXXXX. Tutti gli altri numeri telefonici vengono sostituiti con lo stesso valore.

  • È possibile specificare le opzioni di redazione avanzate per i criteri basati sulle classi di dati con opzioni di mascheramento avanzate. A differenza del metodo redact predefinito, i caratteri di sostituzione utilizzati per mascherare i dati dipendono dai caratteri specifici configurati per revisionare i dati. È anche possibile specificare il numero di caratteri per mascherare i dati. Con i dati redatti avanzati, il formato dei dati non viene conservato, ma l'integrità dei dati viene preservata.

    Ad esempio, se un tipo di colonna è un numero intero e 0 è configurato per la redazione di numeri interi, i dati vengono redatti con 0000000000. Se un tipo di colonna è una stringa e X è configurato per la redazione di stringhe, i dati vengono redatti con XXXXXXXXXX. Se un tipo di colonna è configurato per la data e 2022-06-30 è configurato per le date di revisione, i dati sono redatti con 2022-06-30.

    Tuttavia, le opzioni di mascheramento avanzate non vengono applicate automaticamente. È necessario applicarlo agli asset di dati selezionati in un progetto e quindi pubblicare gli asset mascherati in un catalogo.

Sostituisci

Il metodo di sostituzione sostituisce i dati con valori che non corrispondono al formato originale. Tuttavia, conserva l'integrità referenziale per i valori ripetuti per tutti gli asset nel catalogo. I valori sostituiti sono privi di significato e il formato originale dei valori non può essere determinato. Il sostituto fornisce la sicurezza e l'utilità dei dati tra i metodi Redact e Obfuscate.

Ad esempio, il numero di telefono 510-555-1234 viene sempre sostituito con 500ddcc98133703531re3456.

Offusca

Il metodo di offuscamento sostituisce i valori dei dati con valori formattati in modo simile che corrispondono al formato originale e conserva l'integrità referenziale per i valori ripetuti. Poiché i valori offuscati sono formattati in modo simile, possono essere valori validi. L'offuscamento è il metodo di mascheramento meno sicuro, ma risulta nei dati mascherati più utili.

Ad esempio, il numero di telefono 510-555-1234 viene sempre sostituito con 415 -987-6543.

Tuttavia, il metodo di offuscamento è limitato ai valori dei dati nelle colonne che hanno assegnato classi di dati con i seguenti tipi di informazioni:

  • Le informazioni personali, ad esempio, gli attributi di base di un individuo, come il suffisso onorifico o del nome.
  • Dettagli di contatto, ad esempio, indirizzi email, numeri di telefono, stato, indirizzi postali, latitudine o longitudine.
  • Conti finanziari, ad esempio, carte di credito, banche o altri numeri di conto finanziario.
  • Identità del governo, ad esempio, i numeri di identificazione personale emessi dai governi, come SSN (numeri di previdenza sociale degli Stati Uniti) e CCN (numeri di carta di credito).
  • Informazioni demografiche personali, ad esempio, religione, etnia, stato civile, hobby o stato del dipendente.
  • Dati di connettività, ad esempio, indirizzo IP o indirizzo mac.

Se si crea una regola per offuscare i dati e la regola viene applicata ai dati a cui non è assegnata una classe di dati che supporta l'offuscamento, viene utilizzato il metodo di sostituzione.

È possibile specificare opzioni di offuscamento avanzate per i criteri di mascheramento basati su classi di dati con mascheramento dati avanzato. Tuttavia, il mascheramento dati avanzato non viene applicato automaticamente. È necessario applicarlo agli asset di dati selezionati in un progetto e quindi pubblicare gli asset mascherati in un catalogo.

Icona Guarda video Guarda questo video per vedere come mascherare i dati.

Questo video fornisce un metodo visivo per apprendere i concetti e le attività in questa documentazione.

Ulteriori informazioni

Argomento principale: Regole di protezione dati

Ricerca e risposta AI generativa
Queste risposte sono generate da un modello di lingua di grandi dimensioni in watsonx.ai basato sul contenuto della documentazione del prodotto. Ulteriori informazioni