Translation not up to date
Řízení dat je proces sledování a řízení datových aktiv na základě metadat aktiv. Katalogy jsou pracovní prostory, kde poskytujete řízený přístup k řízeným aktivům.
- Nezbytná služba
- Watson Knowledge Catalog
Katalog obsahuje aktiva a spolupracovníky. Spolupracovníci jsou osoby, které přidávají aktiva do katalogu, a osoby, které potřebují aktiva používat. Řízení dat můžete upravit tak, aby bylo možné obohatit a řídit datová aktiva v katalozích.
Získejte další informace o řízení nebo začněte s katalogy a řízením:
Přístupy k řízení dat
Řízení dat můžete nastavit iterativním způsobem. Můžete začít s jednoduchou implementací řízení dat, která spoléhá na předdefinované artefakty a výchozí funkce. Poté, jak se změní vaše potřeby, můžete upravit rámec řízení dat tak, aby lépe popisoval a chránil vaše datová aktiva.
Chcete-li zobrazit nástroje, které můžete použít k řízení dat, otevřete mapu nástrojů a služeb a klepněte na volbu Regulace v sekci úloh.
Nejjednodušší implementace správy dat
Katalog použijete ke sdílení aktiv v rámci vaší organizace. Katalog může fungovat jako úložiště funkcí tím, že obsahuje datové sady se sloupci, které se používají jako funkce (vstupy) v modelech strojového učení. Administrátor produktu Watson Knowledge Catalog musí vytvořit katalog pro sdílení aktiv a přidat datové inženýry, datové specialisty a obchodní analytiky jako spolupracovníky. Spolupracovníci katalogu mohou pracovat s aktivy katalogu zkopírováním do projektů a mohou publikovat aktiva, která vytvoří v projektech do katalogu.
Spolupracovníci v katalogu mohou přidávat aktiva do katalogu, aby je sdíleli s ostatními, nebo mohou vyhledávat a používat aktiva následujícími způsoby:
- Datoví inženýři přidávají do katalogu vyčištěná data, virtualizovaná data a integrovaná data.
- Datoví inženýři importují tabulky nebo soubory ze zdroje dat do katalogu.
- Datoví vědci a obchodní analytici vyhledávají datová aktiva v katalozích a přidávají je do projektů pro práci s daty.
Datová aktiva shromažďují metadata v průběhu času následujícími způsoby:
- Datová aktiva jsou profilována, což automaticky přiřazuje předdefinované datové třídy, které popisují formát dat.
- Spolupracovníci v katalogu přidávají značky, předdefinované obchodní podmínky, datové třídy a klasifikace, relace a hodnocení k aktivům.
- Všechny akce na aktivech se automaticky uloží do historie aktiv.
Viz Vytvoření katalogu.
Volby přizpůsobení pro řízení dat
Do implementace řízení dat můžete kdykoli přidat nebo aktualizovat libovolné vlastní volby. Váš řídící tým může vytvořit váš obchodní slovník, importovat a obohatit data pomocí vašeho slovníku, analyzovat kvalitu dat, definovat pravidla pro ochranu dat a poté publikovat datová aktiva do katalogu, kde je mohou spotřebitelé dat najít. Když se vaše data změní, můžete znovu importovat metadata o tabulkách nebo souborech a obohatit svá datová aktiva o svůj obchodní slovník a analýzu kvality dat. Při rozšiřování obchodního slovníku můžete vytvářet stále přesnější pravidla pro ochranu dat. V průběhu celého cyklu řízení dat mohou vaši datoví specialisté a další spotřebitelé dat najít důvěryhodná data v katalozích. Následující obrázek ukazuje, jak je řízení dat souvislým cyklem aktualizace metadat pro datová aktiva, aby odrážela změny v datech a změny ve vašem obchodním slovníku.
Vytvořte si svůj obchodní slovník
- Váš řídící tým může vytvořit obchodní slovník, který popisuje význam dat s obchodními termíny a formát dat s třídami dat. Obchodní slovník pomáhá vašim firemním uživatelům snadněji najít to, co hledají, pomocí netechnických termínů.
- Váš tým může rychle vytvořit obchodní slovník importováním stávajícího obchodního slovníku nebo importováním Knowledge Accelerators , které poskytují desítky až tisíce artefaktů řízení.
- Administrátor produktu Watson Knowledge Catalog může upravit sled prací, organizaci, vlastnosti a vztahy artefaktů řízení.
Import a obohacení datových aktiv pomocí obchodního slovníku
- Správci dat mohou pravidelně spouštět úlohy importu a obohacení metadat, které aktualizují katalog o změny tabulek nebo souborů ze zdrojů dat a automaticky přiřazují příslušné obchodní podmínky a třídy dat.
- Když váš tým přidá artefakty řízení, úlohy obohacení metadat navrhnou nové artefakty do nových nebo aktualizovaných datových aktiv.
- Když správci dat potvrdí nebo upraví přiřazení obchodních termínů během obohacení metadat, algoritmy strojového učení pro přiřazení termínů se stanou pro vaše data přesnější.
- Správci dat mohou konfigurovat import a obohacení metadat tak, aby se spouštěla pouze při zjištění změn.
Analyzovat kvalitu dat
- Správci dat mohou analyzovat kvalitu dat s výchozím nastavením během obohacení metadat. Analýza kvality dat se použije na každé aktivum jako celek a na sloupce v tabulkách.
- Správci dat mohou vytvářet vlastní definice kvality dat a používat je v pravidlech kvality dat nebo používat pravidla kvality dat založená na SQL.
Chraňte svá data pomocí pravidel
- Váš řídící tým může vytvořit plán pro pravidla ochrany dat napsáním zásad, které dokumentují standardy a pokyny vaší organizace pro ochranu a správu dat. Zásada může například popisovat specifický předpis a to, jak pravidlo ochrany dat zajišťuje shodu s tímto nařízením.
- Váš řídící tým může vytvořit pravidla ochrany dat, která definují, jak uchovávat soukromé informace. Pravidla ochrany dat jsou automaticky vyhodnocována pro vynucení při každém pokusu uživatele o přístup k datovému aktivu v jakémkoli řízeném katalogu na platformě. Pravidla ochrany dat mohou definovat, jak řídit přístup k datům, maskovat citlivé hodnoty nebo filtrovat řádky z datových aktiv.
- Váš tým může začít s pravidly ochrany dat, která jsou založena na vlastních značkách, uživatelích nebo předdefinovaných datových třídách, obchodních podmínkách a klasifikacích. Když váš řídicí tým přidá artefakty regulace, může tým definovat pravidla ochrany dat na základě vašeho obchodního slovníku.
- Datoví inženýři mohou vynutit pravidla ochrany dat na virtualizovaných datech.
- Datoví inženýři mohou trvale maskovat data v datových aktivech maskováním toků.
Začínáme s produktem Watson Knowledge Catalog
Úlohy pro zahájení práce s produktem Watson Knowledge Catalog závisí na vašem cíli. Akce, které můžete provést, jsou definovány přístupovými rolemi služby Cloud Pak for Data . Některé akce mají také požadavky na role pracovního prostoru, jako např. spolupracovník v katalogu nebo kategorii.
Chcete-li zkontrolovat přístupové role služeb, prohlédněte si téma Určení účtu IBM Cloud a přístupových rolí služeb. Chcete-li porozumět rolím Watson Knowledge Catalog , prohlédněte si role a oprávnění uživatelů.
Následující tabulka zobrazuje společné cíle, požadované přístupové role služby Cloud Pak for Data a odkazy na informace, abyste mohli začít.
Cíl | Požadovaná přístupová role služby Cloud Pak for Data | Další informace |
---|---|---|
Nastavení nebo správa produktu Watson Knowledge Catalog | Správce | Plánování implementace řízení dat Nastavení Watson Knowledge Catalog Správa Watson Knowledge Catalog |
Vyhledat aktiva nebo funkce v katalogu | Libovolná role | Vyhledání aktiv v katalogu Vyhledávání aktiv v rámci platformy Přidání aktiva katalogu do projektu |
Zpracování dat | CloudPak Data Steward nebo CloudPak Data Engineer |
Kurátorka dat Plánování zpracování dat |
Správa kvality dat | CloudPak Data Steward nebo CloudPak Data Engineer |
Správa kvality dat |
Vytvořit artefakty řízení | CloudPak Data Steward nebo CloudPak Data Engineer |
Správa artefaktů řízení Import Knowledge Accelerators Plánování implementace rámce řízení |
Vytvořit pravidla ochrany dat | CloudPak Data Steward nebo CloudPak Data Engineer |
Pravidla ochrany dat Plánování ochrany dat pomocí pravidel |
Spuštění rozhraní API Watson Knowledge Catalog | Stejná role pro provedení úlohy v uživatelském rozhraní. | Watson |
Generovat sestavy v produktu Watson Knowledge Catalog | Administrátor vytváření sestav | Nastavení vytváření sestav |