Translation not up to date
Příklad použití řízení dat
Mnoho podniků se snaží vyvážit výhody poskytování přístupu k datům s potřebou chránit citlivá data. Cloud Pak for Data as a Service poskytuje metody, které váš podnik potřebuje k automatizaci řízení dat, abyste mohli zajistit, že data budou přístupná i chráněná.
Podívejte se na toto video, abyste viděli příklad použití datového prostředí Fabric pro implementaci řešení řízení dat v produktu Cloud Pak for Data.
Toto video poskytuje vizuální metodu, jak se seznámit s koncepty a úlohami v této dokumentaci.
Výzvy
Mnoho podniků čelí následujícím výzvám v oblasti správy dat:
- Zajištění ochrany dat v měřítku
- Organizace musí dodržovat předpisy o ochraně osobních údajů pro data ve zdrojích dat napříč různými cloudovými platformami a lokálně.
- Přístup k vysoce kvalitním datům
- Organizace musí poskytovat přístup k vysoce kvalitním podnikovým datům v rámci více týmů.
- Vytvoření úplného profilu zákazníka
- Týmy musí vytvářet přesné pohledy na zákazníky ve velkém měřítku, rychle, za účelem optimalizace samoobslužných procesů a správy dat.
- Poskytování samoobslužné spotřeby dat
- Spotřebitelé dat, jako jsou například datoví vědci, se snaží najít a používat data, která potřebují.
Tyto problémy můžete vyřešit implementací datového prostředí Fabric pomocí produktu Cloud Pak for Data as a Service.
Příklad: výzvy zlaté banky
Sledujte příběh Golden Bank, jak řídící tým implementuje řízení dat. Golden Bank má velké množství dat o zákaznících a hypoték, které obsahují citlivá data. Banka chce zajistit kvalitu dat, maskovat citlivá data a zpřístupnit je pro použití v několika odděleních.
Proces
Způsob implementace řízení dat závisí na potřebách vaší organizace. Řízení dat můžete implementovat lineárním nebo iterativním způsobem. Můžete se spolehnout na výchozí funkce a předdefinované artefakty, nebo můžete své řešení upravit.
Chcete-li implementovat řízení dat, může vaše organizace postupovat podle tohoto procesu:
- Vytvořit obchodní slovník
- Definovat pravidla pro ochranu dat
- Uklízejte svá data
- Sdílení dat nebo práce s nimi
Watson Knowledge Catalog a služby Match 360 v produktu Cloud Pak for Data as a Service poskytují všechny nástroje a procesy, které vaše organizace potřebuje k implementaci řešení pro řízení dat.
1. Ustavte si svůj obchodní slovník
Chcete-li čelit výzvám, musí váš tým vytvořit obchodní slovník importováním nebo vytvářením artefaktů regulace, které fungují jako metadata pro klasifikaci a popis dat:
- Než budete moci automatizovat ochranu dat, musí váš tým zajistit, aby byla data, která mají být kontrolována, přesně identifikována.
- Než budete moci analyzovat kvalitu dat, musíte identifikovat formát dat.
- Chcete-li data snadno najít, váš tým musí zajistit, aby byl obsah dat přesně popsán.
V tomto prvním kroku procesu může váš řídicí tým stavět na základech předdefinovaných artefaktů řízení a vytvářet vlastní artefakty řízení, které jsou specifické pro vaši organizaci. Můžete vytvořit artefakty pro popis formátu, obchodního významu, citlivosti, rozsahu hodnot a zásad regulace dat.
Co můžete použít | Co můžete udělat | Nejlepší použít, když |
---|---|---|
Kategorie | Pomocí předdefinované kategorie uložte své artefakty regulace. Vytvořte kategorie pro uspořádání artefaktů regulace v hierarchické struktuře podobné složkám. Přidejte spolupracovníky s rolemi, které definují jejich oprávnění k artefaktům v kategorii. |
Potřebujete více než předdefinovanou kategorii. Chcete jemnou kontrolu toho, kdo může vlastnit, vytvářet a zobrazovat artefakty řízení. |
Sledy prací | Použijte výchozí konfiguraci sledu prací, která neomezuje, kdo vytváří artefakty regulace nebo vyžaduje revize. Nakonfigurujte sledy prací pro artefakty regulace a určete, kdo může vytvářet typy artefaktů regulace v jakých kategoriích. |
Chcete řídit, kdo vytváří artefakty regulace. Před jejich publikováním chcete revidovat artefakty řízení konceptů. |
Artefakty řízení | Použijte předdefinované obchodní termíny, třídy dat a klasifikace. Vytvořte artefakty regulace, které slouží jako metadata pro obohacení, definování a řízení datových aktiv. |
Chcete přidat znalosti a význam k aktivům, abyste pomohli lidem porozumět datům. Chcete zlepšit analýzu kvality dat. |
Knowledge Accelerators | Importujte sadu předdefinovaných artefaktů řízení, abyste zlepšili klasifikaci dat, shodu s předpisy, samoobslužnou analýzu a další operace řízení. | K popisu obchodních problémů, obchodní výkonnosti, odvětvových standardů a předpisů potřebujete standardní slovník. Chcete ušetřit čas importem předem vytvořených artefaktů regulace. |
Příklad: Obchodní slovníček Golden Bank
Vedoucí týmu řízení ve společnosti Golden Bank začne vytvořením kategorie Bankovnictví, která bude obsahovat artefakty řízení, jež má tým v plánu vytvořit. Vedoucí týmu přidá zbytek členů týmu řízení jako spolupracovníky do kategorie Bankovnictví s rolí Editor , aby měli oprávnění vytvářet artefakty řízení. Vedoucí týmu poté nakonfiguruje sledy prací tak, aby za vytváření jednotlivých typů artefaktů odpovídal jiný člen týmu. Všechny sledy prací vyžadují krok schválení vedoucím týmu.
Jeden člen týmu řízení importuje sadu obchodních podmínek z tabulky. Některé obchodní podmínky jsou spojeny s povoláním osobních klientů. Jiný člen týmu vytvoří referenční datovou sadu "Profese", která obsahuje seznam profesí, kde každé povolání má identifikační číslo. Třetí člen týmu vytvoří vlastní datovou třídu "Povolání" pro identifikaci povolání osobních klientů na základě referenční datové sady.
2. Definujte pravidla pro ochranu vašich dat
V dalším kroku procesu váš tým definuje pravidla pro zajištění shody s předpisy o ochraně osobních údajů tím, že řídí, kdo může vidět, jaká data. Váš tým vytváří pravidla ochrany dat, která definují, jak chránit data v řízených katalozích. Váš tým může tato pravidla ochrany dat použít k maskování citlivých dat na základě obsahu, formátu nebo významu dat nebo identity uživatelů, kteří k datům přistupují.
Co můžete použít | Co můžete udělat | Nejlepší použít, když |
---|---|---|
Pravidla ochrany dat | Chrání citlivé informace před neoprávněným přístupem v řízených katalozích tím, že odepře přístup k datům, maskuje datové hodnoty nebo filtruje řádky v datových aktivech. Dynamicky a konzistentně maskuje data v řízených katalozích na uživatelsky definované granulární úrovni. |
Musíte automaticky vynutit ochranu osobních údajů v rámci vašich regulovaných katalogů. Chcete zachovat dostupnost a užitečnost dat a zároveň dodržovat předpisy o ochraně osobních údajů. |
Maskovací toky | Při extrahování kopií nebo podmnožin produkčních dat používejte rozšířené možnosti maskování dat se zachováním formátu. | Potřebujete anonymizovaná tréninková data a testovací sady, které uchovávají integritu dat. |
Zásady a pravidla regulace | Popište a zdokumentujte pokyny, předpisy, standardy nebo postupy vaší organizace pro zabezpečení dat. Popište požadované chování nebo akce pro implementaci zásady regulace. |
Chcete, aby lidé, kteří používají data, porozuměli zásadám řízení dat. |
Příklad: Pravidla ochrany údajů společnosti Golden Bank
K vytvoření prediktivního modelu pro schvalování hypoték potřebují datoví vědci společnosti Golden Bank přístup k datovým sadám, které obsahují citlivá data. Například datoví vědci chtějí přistupovat k tabulce s údaji o žadatelích o hypotéku, což zahrnuje sloupec s čísly sociálního zabezpečení.
Člen týmu řízení vytvoří pravidlo ochrany dat, které maskuje čísla sociálního zabezpečení. Pokud je přiřazená datová třída sloupce v datovém aktivu "US Social Security Number", hodnoty v tomto sloupci se nahradí hodnotou 10 X.
Člen týmu řízení vytvoří zásadu, která obsahuje pravidlo ochrany dat. Zásada popisuje obchodní příčiny implementace pravidla.
3. Kurátorka dat pro sdílení v katalozích
Správci dat řídí vysoce kvalitní datová aktiva v projektech a publikují je v katalozích, kde je mohou najít lidé, kteří data potřebují. Správci dat obohacují datová aktiva přiřazením artefaktů řízení jako metadat, která popisují data a informují o sémantickém vyhledávání dat.
Co můžete použít | Co můžete udělat | Nejlepší použít, když |
---|---|---|
Metadata import | Automaticky naimportujte technická metadata pro data, která jsou přidružena k připojení pro vytvoření datových aktiv. | Musíte vytvořit mnoho datových aktiv ze zdroje dat. Musíte obnovit datová aktiva, která jste naimportovali dříve. |
Obohacení metadat | Profilujte více datových aktiv v jednom spuštění, abyste automaticky přiřadili datové třídy a identifikovali datové typy a formáty sloupců. Automaticky přiřazujte obchodní podmínky k aktivům a generujte návrhy termínů na základě klasifikace dat. Znovu spusťte úlohy importu a obohacení v intervalech, abyste zjistili a vyhodnotili změny datových aktiv. |
Je třeba, abyste zpracovali a publikovali mnoho datových aktiv, která jste importovali. |
Analýza kvality dat | Spusťte analýzu kvality na více datových sadách v jednom spuštění, abyste skenovali společné dimenze kvality dat, jako jsou chybějící hodnoty nebo narušení třídy dat. Neustále sledujte změny obsahu a struktury dat a opakovaně analyzujte změněná data. |
Potřebujete vědět, zda kvalita vašich dat může ovlivnit přesnost vaší analýzy dat nebo modelů. Vaši uživatelé musí identifikovat, které datové sady se mají napravit. |
Průzkumník hlavních dat | Pomocí průzkumníku kmenových dat v produktu IBM Match 360mohou uživatelé a systémy vyhledávat, zobrazovat a analyzovat entity kmenových dat. Uživatelé mohou zjišťovat kmenová data přímo v prostoru, kde očekávají, že je budou spotřebovávat. |
Uživatelé a systémy potřebují celkový pohled na vaše data. Uživatelé a systémy potřebují vyhledávat, zobrazovat a analyzovat hlavní datové entity. Chcete použít rozhraní API pro připojení obchodních aplikací k důvěryhodným hlavním datům. |
Příklad: Vytvrzování dat Golden Bank
Správci dat v týmu řízení začnou importovat metadata pro vytvoření datových aktiv v projektu. Po importu metadat má Golden Bank dvě datová aktiva, která představují tabulky se sloupcem s názvem "ID". Po obohacení metadat jsou tyto sloupce jasně odlišeny jejich přiřazenými metadaty:
- Jednomu sloupci jsou přiřazeny obchodní výrazy "Zaměstnání" a "Povolání" a datová třída "Povolání".
- Druhému sloupci jsou přiřazeny obchodní pojmy "osobní identifikátor" a "soukromá osoba" a datová třída "číslo sociálního zabezpečení USA".
Správce dat provádí analýzu kvality dat na datových aktivech, aby se ujistil, že celkové skóre kvality dat překročí prahovou hodnotu Golden Bank 95%.
Datoví inženýři ve společnosti Golden Bank kombinují zákaznická data z různých systémů v rámci vašeho podniku, stejně jako externí data, s údaji o úvěrovém skóre pro řešení entit a vytvoření konsolidovaného pohledu na zákazníky. Inženýři nastaví a přidají aktiva do obecných dat, namapují atributy datových aktiv, publikují datový model a spustí odpovídající algoritmus pro přípravu dat, která mají být prozkoumána.
Vedoucí týmu řízení vytvoří katalog "Katalog schvalování hypoték" a přidá datové správce a datové specialisty jako katalogové spolupracovníky. Správci dat publikují datová aktiva, která vytvořili v projektu, do katalogu.
4. Sdílení nebo práce s vašimi daty
Katalog pomáhá vašim týmům porozumět vašim datům a zpřístupnit správná data pro správné použití. Datoví vědci a další typy uživatelů si mohou pomoci s daty, která potřebují, zatímco jsou v souladu s podnikovými zásadami přístupu a ochrany dat. Mohou přidávat datová aktiva z katalogu do projektu, kde spolupracují na přípravě, analýze a modelování dat.
Co můžete použít | Co můžete udělat | Nejlepší použít, když |
---|---|---|
Katalogy | Uspořádejte svá aktiva tak, aby byla sdílena mezi spolupracovníky ve vaší organizaci. Využijte sémantické vyhledávání a doporučení založená na umělé inteligenci a pomozte uživatelům najít to, co potřebují. |
Uživatelé musí snadno pochopit, spolupracovat, obohatit a přistupovat k vysoce kvalitním datům. Chcete-li zvýšit viditelnost dat a spolupráci mezi firemními uživateli. Potřebujete, aby uživatelé zobrazovali, přistupoovali, manipulovali a analyzovali data bez pochopení jejich fyzického formátu nebo umístění a aniž by je museli přesouvat nebo kopírovat. Chcete, aby uživatelé rozšířili aktiva ohodnocením a přezkoumáním aktiv. |
Globální vyhledávání | Vyhledejte aktiva ve všech projektech, katalozích a prostorech implementace, ke kterým máte přístup. Vyhledejte artefakty řízení napříč kategoriemi, ke kterým máte přístup. |
Musíte najít data nebo jiný typ aktiva nebo artefakt řízení. |
Data Refinery | Vyčistěte data, abyste opravili nebo odebrali data, která jsou nesprávná, neúplná, nesprávně formátovaná nebo duplikovaná. Tvar dat můžete upravit filtrováním, řazením, kombinováním nebo odebráním sloupců. |
Musíte zlepšit kvalitu nebo užitečnost dat. |
Příklad: Katalog zlaté banky
Datoví vědci naleznou datová aktiva, která potřebují, v katalogu a zkopírují je do projektu. Ve svém projektu mohou datoví vědci data upřesnit a připravit je na trénování modelu.
Výukové programy pro řízení dat
Výukový program | Popis | Odborné znalosti pro výukový program |
---|---|---|
Kurovat vysoce kvalitní data | Vytvářejte vysoce kvalitní datová aktiva obohacením dat a spuštěním analýzy kvality dat. | Spusťte nástroje Metadata import a nástroje pro obohacení metadat. |
Chraňte svá data | Řízení přístupu k datům v produktu Cloud Pak for Data as a Service. | Vytvořte pravidla ochrany dat. |
Spotřebovávat data | Vyhledávání, tvarování a analýza dat. | Prozkoumejte katalog a spusťte nástroj Data Refinery . |
virtualizovaná data řízení | Obohacení virtualizovaných dat a zajištění ochrany virtuálních dat. | K řízení virtualizovaných dat použijte rozhraní, projekty a katalogy produktu Watson Query . |
Konfigurovat zobrazení 360 stupňů | Nastavte, mapujte a modelujte svá data, abyste vytvořili konsolidovaný pohled na své zákazníky. | Pomocí rozhraní pro přetažení pomocí myši Match 360 nakonfigurujte konsolidovaný pohled. |
Další informace o řízení dat
- Watson Knowledge Catalog
- Nastavení Watson Knowledge Catalog
- Plánování implementace do řízení dat
- Videa
Nadřízené téma: Přehled řešení datového prostředí Fabric