0 / 0
Go back to the English version of the documentation
Maskování dat pomocí toku Maskování
Last updated: 27. 7. 2023
Maskování dat pomocí toku Maskování

Maskování toku dat umožňuje správcům dat vytvářet maskované kopie dat pro vědce dat, obchodní analytiky a testery aplikací. Data jsou chráněna pravidly ochrany dat, která platí automaticky pro všechna data importovaná do katalogu.

Moskový tok také zavádí rozšířené volby maskování pro pravidla ochrany dat, jako je například rozšířená ochrana formátu, jednosměrná hašovaná tokenizace, vratné šifrování, schopnost udržovat vztahy a obslužný program maskovaných dat. Pravidla pro ochranu dat s pokročilým maskováním fungují pouze v projektech.

Požadované služby
Watson Knowledge Catalog
Formát dat
Relační: Tabulky v relačních zdrojích dat
Velikost dat
Libovolná velikost

Před vytvořením maskovacích toků musí administrátor dat provést tyto úlohy předpokladů.

Po dokončení nezbytných úloh jsou administrátoři dat i uživatelé dat schopni provádět jednu z následujících úloh:

  • Vytvořit nový projekt a přidat datová aktiva, která budou maskována v projektu.
  • Vyberte existující projekt s datovými aktivy.

Po dokončení jedné z úloh klepněte na volbu Nové aktivum > Přetékat proud.

Role uživatele v toku Maskování

Jako administrátor dat (nebo technik pro práci s daty) máte silné znalosti o datových aktivech a o požadavcích na data uživatelů dat. Jste odpovědni za přípravu dat pro maskování a konfiguraci přístupu uživatelů dat k maskovaným datům. Prohlédněte si úlohy, které musí administrátoři dat dokončit.

Jako datový uživatel, jako např. vědci dat, obchodní analytici, testeři a vývojáři, se spoléháte na správce dat, aby vycucoval a poskytl chráněná data, která potřebujete k provedení vaší práce. Prohlédněte si úlohy, které mohou uživatelé dělat.

Podporované zdroje dat

Maskování toku podporuje následující relační a nerelační zdroje dat:

  • Apache Hive
  • Db2 LUW
  • Db2 Warehouse
  • MySQL
  • Netezza
  • Oracle
  • PostgreSQL
  • SQL Server
  • Teradata

Nezbytné úlohy pro administrátory dat

Požadovaná oprávnění
Musíte být administrátor účtu IBM Cloud .

V době, kdy je nainstalován modul Masking, je ve vaší organizaci nastaven alespoň jeden administrátorský účet. Tento administrátor může udělit ostatním uživatelům přístup administrátora.

Připravte se na privatizaci dat provedením následujících úloh:

  1. Vytvoření katalogů.

  2. Přidejte datová aktiva do katalogů tak, že automaticky naimportujete datová aktiva s metadaty. Vytváříte připojení k vašim datům v katalogu metadat. Při importu datových aktiv vyberte katalog, který byl vytvořen v předchozím kroku jako cíl importu. Viz Publikování aktiv z projektu do katalogu.

  3. Potvrzení, že třídy dat jsou správně přiřazeny.

  4. Nastavení pravidel ochrany dat. Pravidla ochrany dat se vztahují na všechny regulované katalogy a jsou vynucována tokem dat, když vytváříte maskované kopie dat pomocí maskovacích toků. Rozšířené volby maskování dat jsou povoleny pouze pro datové třídy.

  5. Správa uživatelského přístupu přidáváním uživatelů k účtu IBM Cloud a nastavení Cloud Pak for Data as a Service pro vaši organizaci.

  6. Přidání uživatelů dat do katalogů pomocí správy přístupu ke katalogu.

Vyvarujte se neúmyslného úniku dat

Přesun aktiv z katalogů do projektů

Standardně nejsou pravidla ochrany dat pro vlastníka aktiva vynucována, uživatel, který přidal aktivum do katalogu. To znamená, že pro vlastníka aktiva nejsou předem zobrazná zobrazení katalogu chráněna pro aktiva, která vlastní.

  • Přesunete-li aktivum z katalogu do projektu, aktivum v projektu je kopií aktiva katalogu. Aktiva projektu nejsou propojena s pravidly ochrany dat.
    • Je-li osoba, která přesouvá aktivum, vlastníkem aktiva, náhled aktiva je demaskován pro všechny uživatele v projektu.
    • Pokud osoba, která přesouvá aktivum, není vlastníkem aktiva, je náhled aktiva zamaskován pro všechny uživatele v projektu.

Protože nejsou pravidla ochrany dat vynucována pro vlastníky aktiv, když vlastníci aktiv spustí maskovací tok, kopie dat načtená do cílové databáze není maskována. Data jsou maskována pouze v případě, že uživatelé dat spouštějí tok maskování.

Nejlepší postup pro zamezení neúmyslného úniku dat

Zvažte následující doporučené postupy, abyste se vyvarovali úniku dat:

  • Projekt použitý administrátorem k importu metadat do katalogu by se neměl používat pro maskování toků.  Chcete-li použít stejný projekt pro importy a maskování metadat, ujistěte se, že všichni uživatelé v projektu mají oprávnění zobrazit nemaskovaná data.

  • Produkt Data admins by neměl přesouvat data z katalogů do projektů pro vytváření maskovacích toků. Data admins by měla do katalogu přidávat uživatele dat jako prohlížeče a potom by měli data z katalogu přesouvat pouze uživatelé dat z katalogu do projektu. Mohou do projektu volitelně přidat další uživatele.

Vyvarujte se chyb nedostatku paměti

Během úlohy maskování zakrytí se může Spark pokusit přečíst všechny zdroje dat do paměti. Chyby se mohou vyskytnout, když není k dispozici dostatek paměti pro podporu úlohy. Největší objem dat, která se mohou vejít do největšího implementovaného uzlu Spark, je přibližně 12GBs.

Chcete-li zabránit nedostatku paměti v případě maskování úloh toku, které mají vysoké využití paměti, postupujte takto:

  • Omezte počet vykonavatelů a velikost vykonavatelů pro úlohu.
  • Nastavit sloupce ve zdrojové tabulce pro rozdělení dat na oblasti.
  • Při přesouvání velkého množství dat se ujistěte, že jste vybrali sloupce, podle kterých mohou být data rozdělena během úlohy zpracování maskování.

Výstup byl zkrácen na omezení délky sloupce

Délka sloupce je maximální délka, která je definovaná pro sloupec v databázi pro data typu řetězec.

Dříve vygenerovaný maskovací výstup neúčtoval délku sloupce a úloha maskování toku by selhala, pokud by některá z výstupních hodnot překročila délku sloupce.

Vygenerovaný výstup se nyní zkrátí, aby se zajistilo, že nepřekročí omezení délky sloupce.

Nezbytné úlohy pro uživatele dat

Uživatelé dat musí již být členem platformy nebo mít úroveň oprávnění pro roli vědců dat.

Požadovaná oprávnění
Musíte mít účet IBM Cloud a mít nárok na plán produktu Watson Knowledge Catalog Lite.

Volitelná oprávnění

  • Produkt Data admins vám může poskytnout přístup redaktora nebo Prohlížeče ke katalogům.
  • Data admins nebo další uživatelé dat vám mohou také poskytnout přístup k jednotlivým projektům, které vytvářejí.

Připravte maskované kopie dat provedením následujících úloh:

  1. Vytvoření projektů.
  2. Vytvořte maskovací aktivum toku.
  3. Spuštění zakrytí úloh toku.

Další informace

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more