Případ použití regulace dat
Mnoho podniků se snaží vyvážit výhody z poskytování přístupu k údajům s potřebou chránit citlivá data. Cloud Pak for Data as a Service poskytuje metody, které váš podnik potřebuje pro automatizaci správy dat, takže můžete zajistit, aby data byla přístupná i chráněná.
Podívejte se na toto video a prohlédněte si příklad použití datového prostředí Fabric pro implementaci řešení regulace dat v produktu Cloud Pak for Data.
Toto video poskytuje vizuální metodu pro seznámení se s koncepty a úlohami v této dokumentaci.
Výzvy
Mnoho podniků se potýká s těmito výzvami v oblasti správy dat:
- Poskytování privátnosti dat v měřítku
- Organizace musí dodržovat pravidla ochrany osobních údajů pro data ve zdrojích dat napříč více cloudovými platformami a lokálně provozně.
- Přístup k datům vysoké kvality dat
- Organizace musí poskytovat přístup k podnikovým datům s vysokou kvalitou ve více týmech.
- Vytvoření kompletního profilu zákazníka
- Týmy potřebují sestavovat přesné pohledy na zákazníky v měřítku, rychle, aby optimalizovali samoobslužné procesy a správu dat.
- Poskytování samoobslužné datové spotřeby
- Spotřebitelé dat, jako např. data vědců, se snaží najít a používat potřebná data.
Tyto výzvy můžete vyřešit implementací datového prostředí Fabric se službou Cloud Pak for Data as a Service.
Příklad: výzvy Golden Bank
Sledovat příběh Golden Bank jako řídicí tým implementuje řízení dat. Banka Golden Bank má velké množství údajů o zákaznících a hypotékách, které zahrnují citlivá data. Banka chce zajistit kvalitu dat, maskovat citlivá data a zpřístupnit ji pro použití v několika odděleních.
Proces
Způsob implementace řízení dat závisí na potřebách vaší organizace. Regulace dat můžete implementovat v lineárním nebo iterativním způsobem. Můžete se spolehnout na výchozí funkce a předdefinované artefakty, nebo můžete přizpůsobit své řešení.
Chcete-li implementovat řízení dat, může se vaše organizace řídit tímto procesem:
- Ustanovte svůj obchodní slovník
- Definování pravidel pro ochranu vašich dat
- Prověření a konsolidace dat
- Sdílení nebo práce s daty
Služby Watson Knowledge Catalog a Match 360 v produktu Cloud Pak for Data as a Service poskytují všechny nástroje a procesy, které vaše organizace potřebuje k implementaci řešení správy dat.
1. Vytvoření obchodního slovníčku
Chce-li váš tým splnit výzvy, musí vytvořit obchodní slovník importem nebo vytvořením artefaktů regulace, které se chovají jako metadata pro klasifikaci a popis dat:
- Než budete moci automatizovat utajení dat, musí váš tým zajistit, aby byla data určená k řízení přesně identifikována.
- Než budete moci analyzovat kvalitu dat, musíte identifikovat formát dat.
- Chcete-li usnadnit vyhledávání dat, musí váš tým zajistit, aby byl obsah dat přesně popsán.
V tomto prvním kroku procesu může váš řídící tým stavět na základech předdefinovaných artefaktů regulace a vytvářet vlastní artefakty regulace, které jsou specifické pro vaši organizaci. Můžete vytvořit artefakty, které popisují formát, obchodní význam, citlivost, rozsah hodnot a zásady regulace dat.
Co lze použít | Co můžete dělat | Nejlepší pro použití, když |
---|---|---|
Kategorie | Pomocí předdefinované kategorie můžete uložit své artefakty regulace. Vytvářejte kategorie pro uspořádání artefaktů regulace v hierarchické struktuře podobné složkám. Přidejte spolupracovníky s rolemi, které definují jejich oprávnění na artefaktech v dané kategorii. |
Potřebujete více než předdefinovanou kategorii. Chcete mít podrobnější řízení, kdo může vlastnit, vytvářet a zobrazovat artefakty regulace. |
Sledy prací | Použijte výchozí konfiguraci sledu prací, která neomezuje uživatele, který vytváří artefakty regulace, nebo vyžaduje revize. Konfigurace sledů prací pro artefakty regulace a určení, kdo může vytvářet, které typy artefaktů regulace ve kterých kategoriích. |
Chcete řídit, kdo vytváří artefakty regulace. Chcete-li před publikováním publikovat koncepty artefaktů regulace, musíte je přezkoumat. |
Artefakty regulace | Použijte předdefinované obchodní podmínky, datové třídy a klasifikace. Vytvořte artefakty regulace, které slouží jako metadata pro obohacení, definování a řízení datových aktiv. |
Chcete přidat znalosti a význam pro aktiva, která pomohou lidem porozumět datům. Chcete zlepšit analýzu kvality dat. |
Knowledge Accelerators | Importujte sadu předdefinovaných artefaktů regulace, abyste vylepšili klasifikaci dat, shodu s předpisy, samoobslužné analýzy a jiné operace řízení. | Potřebujete standardní slovník pro popis obchodních problémů, obchodní výkonnosti, odvětvových standardů a předpisů. Chcete ušetřit čas tím, že importujete předem vytvořené artefakty regulace. |
Příklad: obchodní slovník Golden Bank
Vedoucí týmu v oblasti Golden Bank začíná vytvořením kategorie, Bankovnictví, která má obsahovat artefakty regulace, které má tým vytvořit. Vedoucí týmu přidá zbývající členy týmu správy jako spolupracovníky do kategorie Bankovnictví s rolí Editor , takže mají oprávnění k vytváření artefaktů regulace. Poté vedoucí týmu nakonfiguruje sledy prací tak, aby za vytvoření každého typu artefaktu odpovídal jiný člen týmu. Všechny sledy prací vyžadují krok schválení vedoucím týmu.
Jeden člen týmu správy importuje sadu obchodních termínů z tabulky. Některé z obchodních termínů jsou spojeny s profesemi osobních klientů. Jiný člen týmu vytváří referenční datovou sadu, "Profese", která obsahuje seznam povolání, kde má každá držba identifikační číslo. Třetí člen týmu vytvoří vlastní třídu dat, "Profese" pro identifikaci profese osobních klientů na základě referenční datové sady.
2. Definování pravidel pro ochranu vašich dat
V dalším kroku procesu váš tým definuje pravidla k zajištění dodržování předpisů na ochranu osobních údajů tím, že kontroluje, kdo může vidět, jaká data. Váš tým vytváří pravidla pro ochranu dat, která definují způsob ochrany dat v regulovaných katalozích. Váš tým může použít tato pravidla ochrany dat k maskování citlivých dat na základě obsahu, formátu nebo významu dat nebo identity uživatelů, kteří přistupují k datům.
Co lze použít | Co můžete dělat | Nejlepší pro použití, když |
---|---|---|
Pravidla ochrany dat | Ochraňujte citlivé informace z neoprávněného přístupu v regulovaných katalozích odepřením přístupu k datům, maskováním hodnot dat nebo filtrováním řádků v datových aktivech. Dynamicky a konzistentně zamaskuje data v regulovaných katalozích na úrovni uživatele, která definuje úroveň podrobností. |
Je třeba automaticky vynutit utajení dat ve svých regulovaných katalozích. Chcete zachovat dostupnost a obslužný program dat, zatímco budete zároveň dodržovat předpisy o ochraně osobních údajů. |
Maskování toků | Při extrahování kopií nebo podmnožin produkčních dat použijte rozšířený formát uchování dat při zachování formátu. | Potřebujete anonymizovaná školicí data a sady testů, které uchovávají integritu dat. |
Zásady a pravidla regulace | Popište a zdokumentovat pokyny vaší organizace, předpisy, standardy nebo procedury pro zabezpečení dat. Popište požadované chování nebo akce pro implementaci zásady regulace. |
Chcete, aby lidé, kteří používají data, porozuměli zásadám řízení dat. |
Příklad: Pravidla pro ochranu údajů Golden Bank
K vytvoření prediktivního modelu pro schválení hypotéky potřebují vědci společnosti Golden Bank přístup k datovým sadám, které zahrnují citlivá data. Vědci dat chtějí například přistupovat k tabulce s daty o hypotečních uchazečích, která obsahuje sloupec s čísly sociálního zabezpečení.
Člen týmu správy vytvoří pravidlo ochrany dat, které maskuje čísla sociálního zabezpečení. Je-li přiřazená datová třída sloupce v datovém aktivu "US Social Security Number", budou hodnoty v tomto sloupci nahrazeny 10 X.
Člen projektového týmu vytváří zásadu, která obsahuje pravidlo pro ochranu dat. Zásada popisuje obchodní důvody pro implementaci pravidla.
3. Prověření dat pro sdílení v katalozích
Data stevars culují vysoce kvalitní datová aktiva v projektech a publikují je do katalogů, kde je mohou najít lidé, kteří je potřebují. Data stewards obohacují datová aktiva tím, že přiřadí artefakty regulace jako metadata popisující data a informují sémantické vyhledávání pro data.
Co lze použít | Co můžete dělat | Nejlepší pro použití, když |
---|---|---|
Metadata import | Automaticky importovat technická metadata pro data, která jsou přidružena k připojení k vytvoření datových aktiv. | Je třeba vytvořit mnoho datových aktiv ze zdroje dat. Musíte obnovit dříve naimportovaná datová aktiva. |
Obohacení metadat | Profilovat více datových aktiv v rámci jediného spuštění pro automatické přiřazení datových tříd a identifikaci datových typů a formátů sloupců. Automaticky přiřadit obchodní výrazy k aktivům a generovat návrhy výrazů na základě klasifikace dat. Znovu spusťte import a úlohy obohacení v intervalech, abyste zjistili a vyhodnotili změny v datových aktivech. |
Musíte omezit a publikovat mnoho datových aktiv, která jste naimportovali. |
Analýza kvality dat | Spustit analýzu kvality na více datových sadách v jednom běhu ke skenování pro společné dimenze kvality dat, jako jsou chybějící hodnoty nebo narušení třídy dat. Souvislé sledování změn obsahu a struktury dat a opakované analýzy změněných dat. |
Musíte vědět, zda kvalita vašich dat může ovlivnit přesnost vašich analýz dat nebo modelů. Vaši uživatelé musí identifikovat, které datové sady mají být napraveny. |
Průzkumník hlavních dat | S hlavním datovým průzkumníkem v produktu IBM Match 360, uživateli a systémy hledat, prohlížet a analyzovat hlavní datové entity. Uživatelé mohou vyhledávat hlavní data přímo v prostoru, kde mají očekávat, že ji spotřebovávají. |
Uživatelé a systémy potřebují úplné zobrazení vašich dat. Uživatelé a systémy potřebují vyhledávat, zobrazovat a analyzovat hlavní entity dat. Chcete-li připojit své obchodní aplikace k důvěryhodným hlavním datům, chcete použít rozhraní API. |
Příklad: Data culation a konsolidace Zlaté banky
Data, která jsou uložena v týmu regulace, spouští import metadat pro vytvoření datových aktiv v projektu. Po importu metadat má společnost Golden Bank dvě datová aktiva, která představují tabulky se sloupcem s názvem "ID". Po obohacení metadat jsou tyto sloupce jasně rozlišeny přiřazenými metadaty:
- Jeden sloupec je přiřazen obchodním podmínkám "Occupation" a "Profession" a "Profese" třídy dat.
- Do druhého sloupce jsou přiřazeny obchodní výrazy "Osobní identifikátor" a "Soukromý jednotlivec" a datová třída "US Social Security Number".
Datový správce provede analýzu kvality dat na datových aktivech, aby se ujistil, že celkové skóre kvality údajů překračuje prahovou hodnotu společnosti Golden Bank o 95%.
Datoví inženýři v Golden Bank kombinují data zákazníků z různých systémů v rámci vašeho podniku a také externí data, spolu s údaji o úvěrech a vytvářejí konsolidovaný pohled na zákazníky. Technici nastaví a přidají aktiva do hlavních dat, namapují atributy datového aktiva, publikuje datový model a spustí odpovídající algoritmus pro přípravu dat, která má být prozkoumána.
Vedoucí týmu správy vytváří katalog "Mortgage Approval Catalog" a přidává data a vědce dat jako spolupracující spolupracovníci. Data správce dat publikují datová aktiva, která vytvořila v projektu, do katalogu.
4. Sdílení nebo práce s daty
Katalog pomáhá vašim týmům porozumět vašim datům a zpřístupňuje správná data pro správné použití. Vědci dat a další typy uživatelů si mohou pomoci s daty, které potřebují, zatímco zůstanou v souladu se zásadami podnikového přístupu a ochrany dat. Mohou přidávat datová aktiva z katalogu do projektu, kde spolupracují při přípravě, analýze a modelování dat.
Co lze použít | Co můžete dělat | Nejlepší pro použití, když |
---|---|---|
Katalogy | Uspořádejte svá aktiva tak, aby se sdílely mezi spolupracovníky ve vaší organizaci. Využijte výhod sémantického vyhledávání a doporučení pro AI, které uživatelům pomohou najít to, co potřebují. |
Uživatelé musí snadno pochopit, spolupracovat, obohatit a přistupovat ke kvalitním datům. Chcete zvýšit viditelnost dat a spolupráci mezi obchodními uživateli. Potřebujete uživatele k zobrazení, přístupu, manipulaci a analýze dat bez nutnosti porozumět jeho fyzickému formátu nebo umístění a bez nutnosti přesunu nebo kopírování dat. Chcete, aby uživatelé vylepšili aktiva podle hodnocení a přezkoumávání aktiv. |
Globální vyhledávání | Vyhledávat aktiva ve všech projektech, katalozích a prostorech implementace, ke kterým máte přístup. Vyhledat artefakty regulace v kategoriích, ke kterým máte přístup. |
Musíte najít data nebo jiný typ aktiva, nebo artefakt regulace. |
Data Refinery | Vyčistěte data k opravě nebo odebrání dat, která jsou nesprávná, neúplná, nesprávně formátovaná nebo duplikovaná. Data tvaru k přizpůsobení filtrování, řazení, kombinování nebo odebrání sloupců. |
Je třeba zvýšit kvalitu nebo užitečnost dat. |
Příklad: Katalog Golden Bank
Vědci dat nalezli datová aktiva, která potřebují v katalogu, a okopírovat tato aktiva do projektu. Ve svém projektu mohou vědci zpřesnit údaje a připravit je na školení modelu.
Výukové programy pro řízení dat
Výukový program | Popis | Odborné znalosti pro výukový program |
---|---|---|
Prověření vysoce kvalitních dat | Vytvářejte vysoce kvalitní datová aktiva obohacením vašich dat a spuštěním analýzy kvality dat. | Spusťte nástroje Metadata import a nástroje pro obohacení metadat. |
Ochrana dat | Řízení přístupu k datům přes Cloud Pak for Data as a Service. | Vytvořte pravidla pro ochranu dat. |
Spotřebovat vaše data | Nalezení, tvar a analýza dat. | Prozkoumejte katalog a spusťte nástroj Data Refinery . |
Řízení virtualizovaných dat | Vyviňte virtualizovaná data a ujistěte se, že jsou virtuální data chráněna. | Prostřednictvím rozhraní Watson Query , projektů a katalogů se vztahují na virtualizovaná data. |
Konfigurace pohledu 360 stupňů | Nastavit, mapovat a modelovat vaše data pro vytvoření konsolidovaného pohledu na zákazníky. | Přetažením pomocí myši přetáhněte rozhraní Match 360 ke konfiguraci vašeho konsolidovaného pohledu. |
Další informace o řízení dat
- Přehled produktuWatson Knowledge Catalog
- Nastavení produktu Watson Knowledge Catalog
- Plánování implementace správy dat
- Videa
Nadřazené téma: Přehled řešení Fabric dat