Mascheramento dei dati virtuali nella Data Virtualization
È possibile utilizzare regole di protezione dei dati per mascherare i dati virtuali. Quando vengono interrogate, le colonne mascherate restituiscono dati nascosti.
Il mascheramento dei dati si applica solo alle serie di risultati delle query. I dati originali in tabelle e colonne rimangono invariati. Il mascheramento non si applica ai predicati o alle viste della query. È possibile utilizzare il data masking per evitare l'esposizione di dati sensibili. Tuttavia, il mascheramento dei dati non impedisce agli utenti di Data Virtualization di connettersi al servizio e di eseguire query su quei dati. Gli utenti possono unire e raggruppare i dati, generare i report, eseguire analisi e raccogliere informazioni approfondite utilizzando i dati non elaborati, mascherando solo la serie di risultati.
Per ulteriori informazioni, consultare la documentazione di IBM Knowledge Catalog .
Le regole di mascheramento dei dati si applicano solo ai seguenti oggetti di Data Virtualization:
- Oggetti virtualizzati
- Tabelle Db2 native
- Tabelle di query materializzate (MQT)
A seconda del metodo di mascheramento dei dati, i dati vengono redatti, sostituiti o offuscati. Per ulteriori informazioni, consultare Regolamentazione dei dati virtuali con le norme sulla protezione dei dati in Data Virtualization. Un'icona lucchetto () accanto al nome della colonna nei dati virtualizzati indica che i dati nella colonna sono mascherati da una regola di protezione dei dati.
Guarda il seguente video per una panoramica del mascheramento dei dati in Data Virtualization.
Questo video fornisce un metodo visivo per apprendere i concetti e le attività presenti in questa documentazione.
Azioni di mascheramento supportate
- Redazione (Base)
- Associazione dati azione Redact
- L'elenco seguente descrive i tipi di dati mappati per l'azione Redact in Data Virtualization.
- VARCHAR è mascherato in 'XXXXXXXXXX' o' X' * la lunghezza della colonna, a seconda di quale sia più breve.
- CHAR viene mascherato in 'XXXXXXXX' o' X' * la lunghezza della colonna, a seconda di quale sia più breve.
- I tipi di dati numerici sono mascherati a 0.
- DATE è mascherato in '2001-01-01'.
- TIME è mascherato a '00:00:00'.
- TIMESTAMP è mascherato con DATE ('2001-01-01 00:00:00.0').
- BOOLEAN è redatto come "False".
- Redazione parziale (Avanzata)L'opzione per conservare la lunghezza originale del valore mascherato utilizza la lunghezza del seguente:
- Le colonne VARCHAR utilizzano la lunghezza del valore della cella non mascherata.
- Le colonne CHAR utilizzano la lunghezza della colonna.
- Sostituzione
- Associazione dati azione Sostituisci
- CHAR, VARCHAR
- L'azione di mascheramento Sostituisci si basa su un hash sha256 salato e quando viene utilizzato con le colonne CHAR/VARCHAR, ottiene la codifica base64 . La lunghezza della colonna deve essere di almeno 43 byte per evitare conflitti (due input distinti che risultano nello stesso output).
- SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT
- La sostituzione visualizza un hash numerico del valore originale. Se il valore risultante ha un "0" iniziale, lo zero non verrà visualizzato. Ad esempio, un valore mascherato di "02" viene visualizzato solo come "2".
- DATA, DATA/ORA
- La sostituzione visualizza una rappresentazione con hash del valore originale.
- CLOB, BLOB, BINARY, VARBINARY
NULL
(o un valore vuoto se la colonna è definita comeNOT NULL
)- Altri dati
- Ritorna all'azione Redact .
- Offuscamento (Base)
- Offuscamento (Avanzato)
- Mascheramento reversibile
- Opzioni di formattazione caratteri con il metodo Identificativo
- Conserva formato
- Mascheramento irreversibile
- Coerenza ripetibile
- Coerenza casuale
- Convalida input
- Metodo identificativo
Per le opzioni di offuscamento e mascheramento avanzato, sono supportate le seguenti classi di dati.
- Nome persona
- Nome
- Cognome
- Suffisso nome
- Onorifico
- Sesso
- Indirizzo email
- Data di nascita
- Patente di guida
- Tutti i 50 formati di numeri di patente di guida degli Stati Uniti
- SSN (Social Security Number) degli Stati Uniti
- Numero di previdenza sociale USA - Ultimo 4
- Etnia
- Colore degli occhi
- Colore dei capelli
- Hobby / Tempo libero
- Stato civile / civile legale
- Partito politico
- Stato di impiego
- Relazione
- Religione
- Codice lingua o nome secondo ISO 369
- Nome organizzazione
- Identificativo business Dun & Bradstreet
- Numero DUNS
- Azienda Fortune 1000
- Termini commerciali internazionali
- Codice entità commerciale e pubblica amministrazione
- Riga indirizzo
- Riga indirizzo 1
- Riga indirizzo 2
- Riga indirizzo 3
- Nome paese
- Codici paese
- Nome strada Stati Uniti
- Nome capitale stato USA
- Codice postale USA
- Numero di telefono US
- Codici stato Stati Uniti
- Nomi stato Stati Uniti
- Nomi contea Stati Uniti
- Nome stato / provincia
- Città (Inglese)
- Codici provincia Canada
- Nomi provincia Canada
- Latitudine
- Longitudine
- ISO 3166 - 2 codice di stato / provincia del paese
- Indirizzo IP (Internet Protocol)
- Indirizzo IPv6 (Internet Protocol Version 6)
- Codice identificativo banca
- Numero del conto
- Numero carta di credito
- Carta di credito Visa
- Carta di credito American Express
- Carta di credito Master Card
- Rileva carta di credito
- Carta di credito Diners Club
- Carta di credito dell'ufficio di credito del Giappone
- Data
- Data e ora
- Mese
- Temperatura
- Numero di immatricolazione del veicolo tedesco
- Classificazione statistica internazionale delle malattie v10
Note d'utilizzo
- Il supporto per la mascheratura dei dati in Data Virtualization è limitato ai seguenti tipi di dati:
- Stringhe di carattere (CHAR, VARCHAR)
- Numerico (SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT)
- Data e ora (DATE, TIMESTAMP)
- Booleano
- Le colonne del tipo di dati TIME vengono sempre mascherati come 00:00:00.000 indipendentemente da come è definita la regola di mascheramento.
- Le colonne di tipo CLOB, BLOB, BINARY e VARBINARY vengono mascherate come
NULL
(o come un valore vuoto se la colonna è definita comeNOT NULL
) indipendentemente dall'azione di mascheramento. - Il mascheramento non viene applicato ai predicati di query come le clausole WHERE, GROUP BY, JOIN, AVENDO, SELECT DISTINCT e ORDER BY in un'istruzione SQL.
- Affinché le regole di mascheramento dei dati possano essere applicate, gli oggetti virtuali devono essere acquisiti in un catalogo regolamentato e utilizzare il tipo di connessione " Data Virtualization ".
- Le regole di mascheramento dati non possono essere applicate direttamente alle viste. Le serie di risultati delle viste vengono mascherate in base alle regole di protezione dei dati applicabili agli oggetti a cui fa riferimento la vista. È possibile mascherare i dettagli di identificazione dalle tabelle a cui si fa riferimento nella definizione della vista.
- La redazione, anche parziale, delle colonne di tutti i tipi di dati numerici risulterà nel mascheramento come 0.
- Definire le regole di protezione dei dati utilizzando l'interfaccia utente del builder di regole. Data Virtualization supporta le opzioni di redazione parziale descritte in Regolamentazione dei dati virtuali con le norme sulla protezione dei dati in Data Virtualization.
- Per garantire risultati corretti, utilizzare le assegnazioni di classe di dati appropriate per le definizioni di colonna. Ad esempio, non assegnare una classe di dati Codice postale a una colonna di tipo DECIMAL.
- L'offuscamento delle classi di dati non supportate eseguirà sempre il mascheramento dell'identificativo, che maschera le lettere con lettere e le cifre con cifre e conserva le lettere maiuscole e minuscole.
- Quando i valori
NULL
vengono sostituiti o offuscati, viene creato un valore casuale (non deterministico) per le colonne con classi di dati supportate. I valoriNULL
nelle colonne con classi di dati non supportate ritornano alla redazione standard. - Quando il metodo di mascheramento dell'identificativo viene utilizzato con offuscamento, i valori vuoti vengono redatti.
- Le funzioni di aggregazione come SUM potrebbero causare un overflow numerico nel mascheramento di sostituzione. È possibile eseguire il cast della colonna a un tipo di grado superiore come mostrato nel seguente esempio:
SELECT SUM(CAST(VALUE AS DECIMAL(31,0))) FROM PROJECT1.CUSTOMERS
- Quando si utilizza l'opzione convalida input nelle regole di offuscamento , qualsiasi valore di input non riconosciuto dai dizionari interni verrà considerato non valido e verrà invece eseguita la redazione .
- La redazione produce le migliori prestazioni. La sostituzione e l'offuscamento utilizzano algoritmi più avanzati, con conseguente sovraccarico maggiore.
- Le colonne mascherate non possono essere utilizzate in
SELECT
(incluse le viste) derivate da un'operazione set che coinvolge un operatore setEXCEPT
,EXCEPT ALL
,INTERSECT
,INTERSECT ALL
oUNION
.
Limitazioni
- Importante:
Quando si visualizzano in anteprima, si scaricano o si perfezionano Data Virtualization le risorse di dati in servizi di Watson diversi da Data Virtualization, in Cloud Pak for Data (ad esempio, IBM Knowledge Catalog, Watson Studio e Data Refinery) e nei casi in cui si applica il mascheramento dei dati o il filtraggio a livello di riga, l'anteprima è soggetta alle norme sulla protezione dei dati e al controllo di accesso al catalogo o al progetto. Data Virtualization i controlli di accesso non sono applicati.
Il controllo dell'accesso Data Virtualization non viene applicato quando la mascheratura dei dati o il filtraggio a livello di riga si applicano all'anteprima nei servizi " Watson (diversi dalla Data Virtualization). I controlli di accesso interni Data Virtualization, controllati tramite Gestione accessi nell'interfaccia utente di Data Virtualization, non si applicano all'anteprima degli altri servizi 'Watson con mascheramento o filtraggio a livello di riga. È necessario definire le proprie regole per gestire l'accesso a cataloghi, progetti, asset di dati o connessioni per il controllo accessi negli altri servizi Watson .
- Il metodo di mascheramento dell'identificativo non è supportato sui caratteri multibyte. I caratteri multibyte saranno invece sostituiti con `X`.
- Il mascheramento di classi di dati personalizzate non è supportato in Data Virtualization. Viene invece utilizzato il metodo di mascheramento dell'identificativo.
- Le opzioni di formattazione dei caratteri nell'offuscamento non sono supportate e viene invece eseguito il mascheramento dell'identificativo, che maschera le lettere con lettere e cifre con cifre e conserva le lettere maiuscole e minuscole.