0 / 0
Go back to the English version of the documentation
Řízení dat (Watson Knowledge Catalog)
Last updated: 03. 11. 2023
Řízení dat (Watson Knowledge Catalog)

Řízení dat je proces sledování a řízení datových aktiv na základě metadat aktiv. Katalogy jsou pracovní prostory, kde poskytujete řízený přístup k řízeným aktivům.

Nezbytná služba
Watson Knowledge Catalog

Katalog obsahuje aktiva a spolupracovníky. Spolupracovníci jsou osoby, které přidávají aktiva do katalogu, a osoby, které potřebují aktiva používat. Řízení dat můžete upravit tak, aby bylo možné obohatit a řídit datová aktiva v katalozích.

Získejte další informace o řízení nebo začněte s katalogy a řízením:

Přístupy k řízení dat

Řízení dat můžete nastavit iterativním způsobem. Můžete začít s jednoduchou implementací řízení dat, která spoléhá na předdefinované artefakty a výchozí funkce. Poté, jak se změní vaše potřeby, můžete upravit rámec řízení dat tak, aby lépe popisoval a chránil vaše datová aktiva.

Chcete-li zobrazit nástroje, které můžete použít k řízení dat, otevřete mapu nástrojů a služeb a klepněte na volbu Regulace v sekci úloh.

Nejjednodušší implementace správy dat

Katalog použijete ke sdílení aktiv v rámci vaší organizace. Katalog může fungovat jako úložiště funkcí tím, že obsahuje datové sady se sloupci, které se používají jako funkce (vstupy) v modelech strojového učení. Administrátor produktu Watson Knowledge Catalog musí vytvořit katalog pro sdílení aktiv a přidat datové inženýry, datové specialisty a obchodní analytiky jako spolupracovníky. Spolupracovníci katalogu mohou pracovat s aktivy katalogu zkopírováním do projektů a mohou publikovat aktiva, která vytvoří v projektech do katalogu.

Katalogy ukládají a sledují aktiva. Projekty jsou místa, kde uživatelé připravují datová aktiva a sestavují modely. Aktiva se přesouvají mezi katalogem a projekty.

Spolupracovníci v katalogu mohou přidávat aktiva do katalogu, aby je sdíleli s ostatními, nebo mohou vyhledávat a používat aktiva následujícími způsoby:

  • Datoví inženýři přidávají do katalogu vyčištěná data, virtualizovaná data a integrovaná data.
  • Datoví inženýři importují tabulky nebo soubory ze zdroje dat do katalogu.
  • Datoví vědci a obchodní analytici vyhledávají datová aktiva v katalozích a přidávají je do projektů pro práci s daty.

Datová aktiva shromažďují metadata v průběhu času následujícími způsoby:

  • Datová aktiva jsou profilována, což automaticky přiřazuje předdefinované datové třídy, které popisují formát dat.
  • Spolupracovníci v katalogu přidávají značky, předdefinované obchodní podmínky, datové třídy a klasifikace, relace a hodnocení k aktivům.
  • Všechny akce na aktivech se automaticky uloží do historie aktiv.

Viz Vytvoření katalogu.

Volby přizpůsobení pro řízení dat

Do implementace řízení dat můžete kdykoli přidat nebo aktualizovat libovolné vlastní volby. Váš řídící tým může vytvořit váš obchodní slovník, importovat a obohatit data pomocí vašeho slovníku, analyzovat kvalitu dat, definovat pravidla pro ochranu dat a poté publikovat datová aktiva do katalogu, kde je mohou spotřebitelé dat najít. Když se vaše data změní, můžete znovu importovat metadata o tabulkách nebo souborech a obohatit svá datová aktiva o svůj obchodní slovník a analýzu kvality dat. Při rozšiřování obchodního slovníku můžete vytvářet stále přesnější pravidla pro ochranu dat. V průběhu celého cyklu řízení dat mohou vaši datoví specialisté a další spotřebitelé dat najít důvěryhodná data v katalozích. Následující obrázek ukazuje, jak je řízení dat souvislým cyklem aktualizace metadat pro datová aktiva, aby odrážela změny v datech a změny ve vašem obchodním slovníku.

Cyklus úloh řízení dat

Vytvořte si svůj obchodní slovník

  • Váš řídící tým může vytvořit obchodní slovník, který popisuje význam dat s obchodními termíny a formát dat s třídami dat. Obchodní slovník pomáhá vašim firemním uživatelům snadněji najít to, co hledají, pomocí netechnických termínů.
  • Váš tým může rychle vytvořit obchodní slovník importováním stávajícího obchodního slovníku nebo importováním Knowledge Accelerators , které poskytují desítky až tisíce artefaktů řízení.
  • Administrátor produktu Watson Knowledge Catalog může upravit sled prací, organizaci, vlastnosti a vztahy artefaktů řízení.

Viz Plánování implementace rámce regulace.

Import a obohacení datových aktiv pomocí obchodního slovníku

  • Správci dat mohou pravidelně spouštět úlohy importu a obohacení metadat, které aktualizují katalog o změny tabulek nebo souborů ze zdrojů dat a automaticky přiřazují příslušné obchodní podmínky a třídy dat.
  • Když váš tým přidá artefakty řízení, úlohy obohacení metadat navrhnou nové artefakty do nových nebo aktualizovaných datových aktiv.
  • Když správci dat potvrdí nebo upraví přiřazení obchodních termínů během obohacení metadat, algoritmy strojového učení pro přiřazení termínů se stanou pro vaše data přesnější.
  • Správci dat mohou konfigurovat import a obohacení metadat tak, aby se spouštěla pouze při zjištění změn.

Viz Plánování sdílení datových aktiv v katalozích.

Analyzovat kvalitu dat

  • Správci dat mohou analyzovat kvalitu dat s výchozím nastavením během obohacení metadat. Analýza kvality dat se použije na každé aktivum jako celek a na sloupce v tabulkách.
  • Správci dat mohou vytvářet vlastní definice kvality dat a používat je v pravidlech kvality dat nebo používat pravidla kvality dat založená na SQL.

Viz Plánování sdílení datových aktiv v katalozích.

Chraňte svá data pomocí pravidel

  • Váš řídící tým může vytvořit plán pro pravidla ochrany dat napsáním zásad, které dokumentují standardy a pokyny vaší organizace pro ochranu a správu dat. Zásada může například popisovat specifický předpis a to, jak pravidlo ochrany dat zajišťuje shodu s tímto nařízením.
  • Váš řídící tým může vytvořit pravidla ochrany dat, která definují, jak uchovávat soukromé informace. Pravidla ochrany dat jsou automaticky vyhodnocována pro vynucení při každém pokusu uživatele o přístup k datovému aktivu v jakémkoli řízeném katalogu na platformě. Pravidla ochrany dat mohou definovat, jak řídit přístup k datům, maskovat citlivé hodnoty nebo filtrovat řádky z datových aktiv.
  • Váš tým může začít s pravidly ochrany dat, která jsou založena na vlastních značkách, uživatelích nebo předdefinovaných datových třídách, obchodních podmínkách a klasifikacích. Když váš řídicí tým přidá artefakty regulace, může tým definovat pravidla ochrany dat na základě vašeho obchodního slovníku.
  • Datoví inženýři mohou vynutit pravidla ochrany dat na virtualizovaných datech.
  • Datoví inženýři mohou trvale maskovat data v datových aktivech maskováním toků.

Viz Plánování ochrany dat pomocí pravidel.

Začínáme s produktem Watson Knowledge Catalog

Úlohy pro zahájení práce s produktem Watson Knowledge Catalog závisí na vašem cíli. Akce, které můžete provést, jsou definovány přístupovými rolemi služby Cloud Pak for Data . Některé akce mají také požadavky na role pracovního prostoru, jako např. spolupracovník v katalogu nebo kategorii.

Chcete-li zkontrolovat přístupové role služeb, prohlédněte si téma Určení účtu IBM Cloud a přístupových rolí služeb. Chcete-li porozumět rolím Watson Knowledge Catalog , prohlédněte si role a oprávnění uživatelů.

Následující tabulka zobrazuje společné cíle, požadované přístupové role služby Cloud Pak for Data a odkazy na informace, abyste mohli začít.

Cíl Požadovaná přístupová role služby Cloud Pak for Data Další informace
Nastavení nebo správa produktu Watson Knowledge Catalog Správce Plánování implementace řízení dat
Nastavení Watson Knowledge Catalog
Správa Watson Knowledge Catalog
Vyhledat aktiva nebo funkce v katalogu Libovolná role Vyhledání aktiv v katalogu
Vyhledávání aktiv v rámci platformy
Přidání aktiva katalogu do projektu
Zpracování dat CloudPak Data Steward nebo
CloudPak Data Engineer
Kurátorka dat
Plánování zpracování dat
Správa kvality dat CloudPak Data Steward nebo
CloudPak Data Engineer
Správa kvality dat
Vytvořit artefakty řízení CloudPak Data Steward nebo
CloudPak Data Engineer
Správa artefaktů řízení
Import Knowledge Accelerators
Plánování implementace rámce řízení
Vytvořit pravidla ochrany dat CloudPak Data Steward nebo
CloudPak Data Engineer
Pravidla ochrany dat
Plánování ochrany dat pomocí pravidel
Spuštění rozhraní API Watson Knowledge Catalog Stejná role pro provedení úlohy v uživatelském rozhraní. Watson
Generovat sestavy v produktu Watson Knowledge Catalog Administrátor vytváření sestav Nastavení vytváření sestav

Další informace

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more