0 / 0
Go back to the English version of the documentation
Rozšířené volby maskování
Last updated: 18. 8. 2023
Rozšířené volby maskování

Rozšířené maskovací volby rozšiřují schopnost pravidel ochrany dat a pravidel umístění dat tím, že chrání data pomocí pokročilých metod odstraňování identifikace. Techniky udržují formát a integritu dat. Obslužný program pro vysoké údaje poskytuje uživatelům datové služby, jako jsou např. vědci dat, obchodní analytici a vývojáři aplikací, aby vytvářeli kvalitní poznatky z chráněných dat.

Rozšířené volby maskování zahrnují následující funkce:

  • Format-konzervace de-identification for 165 pre-defined data classes to maintain utility for AI projects.

    Rada: Pro produkt Watson Query (Data virtualization) jsou vynucována pravidla pro ochranu dat, která jsou definována s rozšířenými volbami maskování. Pravidla mohou implementovat formátování při zachování zamaskování na některém z předdefinovaných datových tříd, kromě produktů IBAN a URL.

  • Reverzibilní šifrování, které je k dispozici pro vytváření kopií dat vytvářením maskovacích toků a jednosměrné tokenizace hašování pro flexibilní shodu.

    Omezení: Volba rozšířeného maskování pro vratnost není podporována, je-li produkt IBM Security Guardium® integrován s produktem Cloud Pak for Data as a Service.
  • Integrita vztahu k konzistentnímu ochraně dat v souvisejících zdrojích dat.

Níže uvedené scénáře popisují, jak rozšířená volba maskování rozšiřuje schopnost pravidel ochrany dat.

Vědci dat chtějí použít finanční data, jako jsou čísla kreditních karet a čísla bankovních účtů ve svém modelu Machine Learning k předvídání podvodných transakcí. Čísla kreditních karet nemohou být XXXXXXXXX, aby vytvořily výsledky, které hledají. Místo toho potřebují skutečná čísla kreditních karet. Metoda zachování formátu v rozšířených maskovacích opcích vytvářejí čísla kreditních karet, která splňují požadavky na formát. Formát požadavků na formát zahrnuje informace o správě výdejky (určení, která kreditní karta (Visa, Mastercard, atd.) vydala kartu), algoritmus kontrolního součtu luhn a tak dále. Realistický maskování zajišťuje, že uživatelé dat mohou produkovat přesné výsledky.

Zdravotnické údaje chtějí používat údaje o pacientech, které obsahují informace o jménu a adrese pacientů, aby analyzovali výsledky z klinických studií terminálových onemocnění. Jméno pacienta nemůže být maskováno "XXXX", aby se vytvořily výsledky, které hledají. Místo toho potřebují realistické názvy a realistické názvy ulic, města a země. V důsledku toho mají uživatelé dat, kteří provádějí analýzy, širší souvislosti, že "Jane Doe", která žije na "123 Maple Lane", je účastníkem studie s rakovinou prsu.

Důležité:

Vzhledem ke specifičnosti rozšířených voleb maskování lze tyto volby v daném okamžiku použít pouze na jednu datovou třídu. Tyto volby jsou optimalizovány pro všech 165 předdefinovaných datových tříd produktu Watson Knowledge Catalog a doporučují se jako nejlepší volby zachování formátu pro každou datovou třídu. Nelze je však použít na třídy dat Watson Knowledge Catalog definované uživatelem.

Volba Rozšířené maskování může být povolena pouze pro metody maskování Redakce a Obfuscate. Rozšířené volby maskování se vztahují na pravidla pomocí produktu mask data in columns containing data class. Obchodní podmínky, názvy sloupců a značky nejsou dosud podporovány.

Poznámka: Když vytváříte tabulky, nepoužívejte speciální znaky pro názvy sloupců zdrojové a cílové tabulky v Hive. Speciální znaky použité ve jménech sloupců nejsou podporovány vnitřními spojeními.

Vytvoření pravidel ochrany dat s rozšířenými možnostmi maskování

Rozšířené volby maskování jsou povoleny pouze pro datové třídy.

  1. Dokončete podmínky a vyberte atributy, které chcete zpracovat. Doporučeným postupem je vytvořit pravidla jedním z následujících způsobů:

    • Pokud třída dat obsahuje jakékoli __insert data class__, pak maskovat data ve sloupcích obsahujících datovou třídu __insert data class__.

    • Volitelně můžete přidat podmínky pro vlastníky aktiv, obchodní termíny, značky a podobně, ale buďte opatrní, abyste porozuměli tomu, jak tyto artefakty regulace fungují. Mohou neúmyslně neunikat nemaskovaná data. Viz Správa pravidel ochrany dat.

    • Maskování vstupních dat, která jsou malá, jako jsou například logické hodnoty nebo čísla s jednoduchou číslicí, může vypadat, že data nebyla maskována, když spustíte maskovací úlohu toku, prohlédněte si náhled nebo stáhněte data. Data jsou však maskována a maskovaná hodnota je stejná jako nemaskovaná hodnota.

  2. Chcete-li maskovat data, vyberte následující metodu:

    • Sloupce redact
    • Zamlžit sloupce

    Náhrada není podporována pro rozšířené maskování.

  3. Vyberte volby maskování v sekci Rozšířené maskovací volby. Některé volby jsou vybrány jako výchozí pro vás. Další informace viz Metoda redakce a Metoda zamaskování dat .

  4. Vytvořte pravidlo. Další informace o tom, jak skrýt data v aktivech, najdete v tématu Data masky .

Použití náhledů maskování

Před zobrazením náhledu v sekci Příklad dat se zobrazí informace o tom, jak jsou data maskována, když zobrazujete data aktiv v katalozích, projektech a dynamicky před spuštěním maskování úloh toku. Po zobrazení náhledu v sekci Příklad dat se zobrazí, jak jsou data maskována v maskovaných kopiích, které jsou vytvořeny spuštěním maskování úloh toku.

Alternativní text:

Další kroky

Další informace

Nadřízené téma: Pravidla ochrany dat

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more