È possibile utilizzare regole di protezione dei dati per mascherare i dati virtuali. Quando vengono interrogate, le colonne mascherate restituiscono dati nascosti.
Il mascheramento dei dati si applica solo alle serie di risultati delle query. I dati originali in tabelle e colonne rimangono invariati. Il mascheramento non si applica ai predicati o alle viste della query. È possibile utilizzare il data masking per evitare l'esposizione di dati sensibili. Tuttavia, il mascheramento dei dati non impedisce agli utenti di Data Virtualization di connettersi al servizio e di eseguire query su quei dati. Gli utenti possono unire e raggruppare i dati, generare i report, eseguire analisi e raccogliere informazioni approfondite utilizzando i dati non elaborati, mascherando solo la serie di risultati.
Le regole di mascheramento dei dati si applicano solo ai seguenti oggetti di Data Virtualization:
- Oggetti virtualizzati
- Tabelle Db2® native
- Tabelle di query materializzate (MQT)
A seconda del metodo di mascheramento dei dati, i dati vengono redatti, sostituiti o offuscati. Per ulteriori informazioni, vedere Gestione dei dati virtuali con regole di protezione dei dati in Data Virtualization. Un'icona di blocco () accanto al nome della colonna nei dati virtualizzati indica che i dati nella colonna sono mascherati da una regola di protezione dati.
Azioni di mascheramento supportate
- Redazione (Base)
- Associazione dati azione Redact
- L'elenco seguente descrive i tipi di dati mappati per l'azione Redact in Data Virtualization.
- VARCHAR è mascherato in 'XXXXXXXXXX' o' X' * la lunghezza della colonna, a seconda di quale sia più breve.
- CHAR viene mascherato in 'XXXXXXXX' o' X' * la lunghezza della colonna, a seconda di quale sia più breve.
- I tipi di dati numerici sono mascherati a 0.
- DATE è mascherato in '2001-01-01'.
- TIME è mascherato a '00:00:00'.
- TIMESTAMP è mascherato con DATE ('2001-01-01 00:00:00.0').
- BOOLEAN è redatto come "False".
- Redazione parziale (Avanzata)
- Sostituzione
- Associazione dati azione Sostituisci
- CHAR, VARCHAR
- L'azione di mascheramento Sostituisci si basa su un hash sha256 salato e quando viene utilizzato con le colonne CHAR/VARCHAR, ottiene la codifica base64 . La lunghezza della colonna deve essere di almeno 43 byte per evitare conflitti (due input distinti che risultano nello stesso output).
- SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT
- La sostituzione visualizza un hash numerico del valore originale. Se il valore risultante ha un "0" iniziale, lo zero non verrà visualizzato. Ad esempio, un valore mascherato di "02" viene visualizzato solo come "2".
- DATA, DATA/ORA
- La sostituzione visualizza una rappresentazione con hash del valore originale.
- CLOB, BLOB, BINARY, VARBINARY
NULL
(o un valore vuoto se la colonna è definita comeNOT NULL
)- Altri dati
- Ritorna all'azione Redact .
- Offuscamento (Base)
- Offuscamento (Avanzato)
- Mascheramento reversibile
- Opzioni di formattazione caratteri con il metodo Identificativo
- Conserva formato
- Mascheramento irreversibile
- Coerenza ripetibile
- Coerenza casuale
- Convalida input
- Metodo identificativo
Per le opzioni di offuscamento e mascheramento avanzato, sono supportate le seguenti classi di dati.
- Nome persona
- Nome
- Cognome
- Suffisso nome
- Onorifico
- Sesso
- Indirizzo email
- Data di nascita
- Patente di guida
- Tutti i 50 formati di numeri di patente di guida degli Stati Uniti
- SSN (Social Security Number) degli Stati Uniti
- Numero di previdenza sociale USA - Ultimo 4
- Etnia
- Colore degli occhi
- Colore dei capelli
- Hobby / Tempo libero
- Stato civile / civile legale
- Partito politico
- Stato di impiego
- Relazione
- Religione
- Codice lingua o nome secondo ISO 369
- Nome organizzazione
- Identificativo business Dun & Bradstreet
- Numero DUNS
- Azienda Fortune 1000
- Termini commerciali internazionali
- Codice entità commerciale e pubblica amministrazione
- Riga indirizzo
- Riga indirizzo 1
- Riga indirizzo 2
- Riga indirizzo 3
- Nome paese
- Codici paese
- Nome strada Stati Uniti
- Nome capitale stato USA
- Codice postale USA
- Numero di telefono US
- Codici stato Stati Uniti
- Nomi stato Stati Uniti
- Nomi contea Stati Uniti
- Nome stato / provincia
- Città (Inglese)
- Codici provincia Canada
- Nomi provincia Canada
- Latitudine
- Longitudine
- ISO 3166 - 2 codice di stato / provincia del paese
- Indirizzo IP (Internet Protocol)
- Indirizzo IPv6 (Internet Protocol Version 6)
- Codice identificativo banca
- Numero del conto
- Numero carta di credito
- Carta di credito Visa
- Carta di credito American Express
- Carta di credito Master Card
- Rileva carta di credito
- Carta di credito Diners Club
- Carta di credito dell'ufficio di credito del Giappone
- Data
- Data e ora
- Mese
- Temperatura
- Numero di immatricolazione del veicolo tedesco
- Classificazione statistica internazionale delle malattie v10
Note d'utilizzo
- Il supporto del mascheramento dei dati in Data Virtualization è limitato ai seguenti tipi di dati:
- Stringhe di carattere (CHAR, VARCHAR)
- Numerico (SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT)
- Data e ora (DATE, TIMESTAMP)
- Booleano
- Le colonne del tipo di dati TIME vengono sempre mascherati come 00:00:00.000 indipendentemente da come è definita la regola di mascheramento.
- Le colonne di tipo CLOB, BLOB, BINARY e VARBINARY vengono mascherate come
NULL
(o come un valore vuoto se la colonna è definita comeNOT NULL
) indipendentemente dall'azione di mascheramento. - Il mascheramento non viene applicato ai predicati di query come le clausole WHERE, GROUP BY, JOIN, AVENDO, SELECT DISTINCT e ORDER BY in un'istruzione SQL.
- Per applicare le regole di mascheramento dei dati, gli oggetti virtuali devono essere acquisiti in un catalogo governato e utilizzare il tipo di connessione Data Virtualization.
- Le regole di mascheramento dati non possono essere applicate direttamente alle viste. Le serie di risultati delle viste vengono mascherate in base alle regole di protezione dei dati applicabili agli oggetti a cui fa riferimento la vista. È possibile mascherare i dettagli di identificazione dalle tabelle a cui si fa riferimento nella definizione della vista.
- La redazione, anche parziale, delle colonne di tutti i tipi di dati numerici risulterà nel mascheramento come 0.
- Definire le regole di protezione dei dati utilizzando l'interfaccia utente del builder di regole. La Data Virtualization supporta le opzioni di eliminazione parziale descritte in Gestione dei dati virtuali con regole di protezione dei dati in Data Virtualization.
- Per garantire risultati corretti, utilizzare le assegnazioni di classe di dati appropriate per le definizioni di colonna. Ad esempio, non assegnare una classe di dati Codice postale a una colonna di tipo DECIMAL.
- L'offuscamento delle classi di dati non supportate eseguirà sempre il mascheramento dell'identificativo, che maschera le lettere con lettere e le cifre con cifre e conserva le lettere maiuscole e minuscole.
- Quando i valori
NULL
vengono sostituiti o offuscati, viene creato un valore casuale (non deterministico) per le colonne con classi di dati supportate. I valoriNULL
nelle colonne con classi di dati non supportate ritornano alla redazione standard. - Quando il metodo di mascheramento dell'identificativo viene utilizzato con offuscamento, i valori vuoti vengono redatti.
- Le funzioni di aggregazione come SUM potrebbero causare un overflow numerico nel mascheramento di sostituzione. È possibile eseguire il cast della colonna a un tipo di grado superiore come mostrato nel seguente esempio:
SELECT SUM(CAST(VALUE AS DECIMAL(31,0))) FROM PROJECT1.CUSTOMERS
- Quando si utilizza l'opzione convalida input nelle regole di offuscamento , qualsiasi valore di input non riconosciuto dai dizionari interni verrà considerato non valido e verrà invece eseguita la redazione .
- La redazione produce le migliori prestazioni. La sostituzione e l'offuscamento utilizzano algoritmi più avanzati, con conseguente sovraccarico maggiore.
- Le colonne mascherate non possono essere utilizzate in
SELECT
(incluse le viste) derivate da un'operazione set che coinvolge un operatore setEXCEPT
,EXCEPT ALL
,INTERSECT
,INTERSECT ALL
oUNION
.
Limitazioni
- Importante:
When you preview, download, or refine Data Virtualization data assets in Watson services other than Data Virtualization, in Cloud Pak for Data (for example, IBM Knowledge Catalog, Watson Studio, and Data Refinery), and in cases when data masking or row-level filtering applies, the preview is subject to the data protection rules and catalog or project access control only. i controlli di accesso Data Virtualization non vengono applicati.
Il controllo dell'accesso Data Virtualization non viene applicato quando la mascheratura dei dati o il filtraggio a livello di riga si applicano all'anteprima nei servizi " Watson (diversi dalla Data Virtualization). I controlli di accesso interni Data Virtualization, controllati tramite Gestione accessi nell'interfaccia utente di Data Virtualization, non si applicano all'anteprima degli altri servizi 'Watson con mascheramento o filtraggio a livello di riga. È necessario definire le proprie regole per gestire l'accesso a cataloghi, progetti, asset di dati o connessioni per il controllo accessi negli altri servizi Watson .
- Il metodo di mascheramento dell'identificativo non è supportato sui caratteri multibyte. Vengono restituiti i caratteri multibyte originali.
- È possibile che vengano visualizzati risultati imprevisti quando si mascherano caratteri a più byte con caratteri a più byte o quando si mascherano caratteri a più byte con caratteri a più byte.
- Il mascheramento delle classi di dati personalizzate non è supportato in Data Virtualization. Viene invece utilizzato il metodo di mascheramento dell'identificativo.
- Le opzioni di formattazione dei caratteri nell'offuscamento non sono supportate e viene invece eseguito il mascheramento dell'identificativo, che maschera le lettere con lettere e cifre con cifre e conserva le lettere maiuscole e minuscole.
- In alcune circostanze, l'anteprima mascherata nei cataloghi o nei progetti potrebbe essere diversa da quella di Data Virtualization.