Translation not up to date
Nakonfigurujte a spusťte obohacení metadat, abyste přidali popisné informace do svých datových aktiv.
Do datového aktiva můžete přidat několik vrstev metadat:
- Profilujte data, abyste je klasifikovali, a kompilujte statistiky o hodnotách.
- Spusťte předdefinované kontroly kvality dat pro počáteční posouzení kvality.
- Obohaťte aktiva o obchodní slovník, který popisuje sémantický význam dat pro vaši organizaci.
- Nezbytná oprávnění
- Chcete-li vytvořit a spustit obohacení metadat, musíte mít v projektu roli Administrátor nebo Editor a musíte mít alespoň přístup pro zobrazení ke kategoriím, které chcete použít v obohacení. Také musíte být autorizováni pro přístup k připojením ke zdrojům dat datových aktiv, která se mají obohatit.
Můžete také vytvořit obohacení metadat pomocí rozhraní API namísto uživatelského rozhraní. Odkazy na tato rozhraní API jsou uvedeny v části Další informace .
Chcete-li vytvořit aktivum obohacení metadat a úlohu pro obohacení dat, postupujte takto:
Otevřete projekt a klepněte na volbu Nové aktivum > Obohacení metadat. Po vytvoření prvního obohacení metadat tímto způsobem můžete přidat nová aktiva obohacení metadat ze stránky Aktivum projektu.
Definovat podrobnosti:
- Zadejte název pro obohacení metadat.
- Volitelné: Zadejte popis.
- Volitelné: Vyberte nebo vytvořte značky, které se mají přiřadit k aktivu obohacení metadat, aby se zjednodušilo vyhledávání. Nové značky můžete vytvořit zadáním názvu značky a stisknutím klávesy Enter.
Nastavit rozsah dat:
Vyberte datová aktiva, která chcete obohatit, z pole Datová aktiva.
Seznam zobrazuje všechna aktiva podporovaných formátů. Můžete obohatit relační a strukturovaná datová aktiva. Můžete vybrat jednotlivá aktiva, ale můžete také vybrat aktiva importu metadat, abyste obohatili celou sadu datových aktiv z těchto importů metadat. Nemůžete však vybrat datová aktiva nebo importy metadat, které jsou již zahrnuty v obohacení metadat. U jednotlivých datových aktiv můžete podržet ukazatel myši nad názvem aktiva, abyste viděli, ve kterém obohacení metadat je aktivum zahrnuto.
Aktivum importu metadat je automaticky vyloučeno z rozsahu výběru v těchto případech:
- Jako cíl importu má katalog.
- Byl spuštěn na připojení, které nepodporuje přístup ke skutečným datům.
Viz Import metadat.
Nezapomeňte: Každé datové aktivum nebo import metadat lze zahrnout pouze do jednoho obohacení metadat na projekt. Chcete-li datové aktivum několikrát obohatit o různé volby obohacení, musíte to provést v oddělených projektech.Přezkoumejte vybraný rozsah. Můžete přímo odstranit aktiva z rozsahu dat nebo můžete přepracovat celý rozsah klepnutím na volbu Upravit rozsah dat.
Až skončíte s upřesňováním rozsahu dat, klepněte na tlačítko Další.
Tento krok můžete přeskočit, chcete-li vytvořit prázdné aktivum obohacení metadat a nastavit rozsah později.
Definujte cíl tohoto aktiva obohacení metadat:
Určete cíl obohacení:
- Data profilu
Poskytuje základní statistiku o obsahu aktiv, přiřazuje a navrhuje datové třídy.
Další informace o statistice viz Podrobné výsledky profilování.
Datové třídy popisují obsah dat ve sloupci: například město, číslo účtu nebo číslo kreditní karty. Třídy dat lze použít k maskování dat pomocí pravidel ochrany dat nebo k omezení přístupu k datovým aktivům pomocí zásad. Kromě toho mohou přispívat k přiřazení termínů, pokud existuje odpovídající datová třída k propojení termínů.
Hodnověrnost datové třídy je procento nenulových hodnot, které odpovídají datové třídě. Skóre hodnověrnosti pro datovou třídu, která má být přiřazena nebo navržena, musí být alespoň stejné jako nastavená prahová hodnota. Viz Nastavení přiřazení datové třídy. Je-li prahová hodnota nastavena přímo na datové třídě, má tato prahová hodnota přednost při přiřazení datových tříd. To se nepovažuje za návrhy. Kromě skóre spolehlivosti se bere v úvahu i priorita datové třídy. Viz Přidání dat odpovídajících datovým třídám.
Několik tříd dat je více generických identifikátorů, které jsou zjištěny a přiřazeny na úrovni sloupce. Tyto třídy dat jsou přiřazeny, když nelze na úrovni hodnoty identifikovat specifičtější třídu dat. Generické identifikátory mají vždy důvěryhodnost 100% a zahrnují následující datové třídy: kód, datum, identifikátor, indikátor, množství a text.
- Spustit základní analýzu kvality
Spustí předdefinované kontroly kvality dat na sloupcích datového aktiva. Sada použitých kontrol je definována v nastavení obohacení. Viz Základní nastavení analýzy kvality a Předdefinované kontroly kvality dat. Každá kontrola může přispět k celkovému skóre kvality dat aktiva. Tento typ analýzy kvality dat lze provést pouze v kombinaci s profilováním. Proto je volba Data profilu automaticky vybrána, když vyberete analýzu kvality dat.
Můžete zvolit, zda chcete zapsat výstup těchto kontrol do databáze. Klepněte na volbu Přizpůsobit a povolte volbu Zapsat výstup do databáze . Pokud existují výchozí nastavení, sekce jsou naplněny odpovídajícím způsobem. Nastavení můžete přepsat. Pokud neexistují žádná výchozí nastavení, nakonfigurujte výstup a umístění výstupu. Informace o tom, které zdroje dat jsou podporovány jako cíl výstupu, viz sloupec Výstupní tabulky v části Podporované zdroje dat. Názvy schémat a tabulek musí dodržovat tuto konvenci:
- První znak pro název musí být abecední znak.
- Zbytek názvu se může skládat z abecedních znaků, číselných znaků nebo podtržítek.
- Název nesmí obsahovat mezery.
Pokud vyberete zápis do existující tabulky, ujistěte se, že má požadovaný formát. Viz Výstup kvality dat.
- Přiřadit podmínky
Automaticky přiřadí obchodní podmínky ke sloupcům a celým aktivům nebo navrhne obchodní podmínky pro ruční přiřazení. Tato přiřazení nebo návrhy jsou generovány sadou služeb. Viz Automatické přiřazení termínu.
V závislosti na tom, které služby přiřazení termínů jsou pro váš projekt aktivní, může přiřazení termínů vyžadovat profilování.
Vyberte kategorie k určení tříd dat a obchodních podmínek, které lze použít během obohacení. Administrátor projektu mohl omezit sadu kategorií, ze kterých si můžete vybrat při vytváření obohacení. Toto omezení neplatí, když upravujete obohacení. V každém případě si můžete vybrat pouze z kategorií, kde jste spolupracovníkem s alespoň rolí Prohlížeč .
Tento výběr platí pouze pro automatická přiřazení a návrhy. Když ručně přiřadíte termíny nebo třídy dat, můžete si vybrat ze všech kategorií, ke kterým máte přístup.
Změny sady kategorií, ze kterých se má vybírat, nebo skutečný výběr kategorií se projeví při příštím spuštění obohacení. Existující přiřazení však zůstávají beze změny.
Pokud je váš přístup k některé z vybraných kategorií odvolán po spuštění obohacení metadat a neprovedete žádné změny obohacení, každé opětovné spuštění bude stále zvažovat všechny vybrané kategorie pro přiřazení datové třídy a termínů.
Vyberte typ vzorkování:
- Základní: Základní vzorkování pracuje s nejmenší možnou velikostí vzorku pro urychlení procesu: Analyzuje se 1000 řádků na tabulku a klasifikace se provádí na základě nejčastějších 100 hodnot na sloupec.
- Střední: Střední vzorkování pracuje se střední velikostí vzorku, aby poskytlo přiměřeně přesné výsledky, aniž by bylo příliš časově náročné: Analyzuje se 10 000 řádků na tabulku a klasifikace se provádí na základě nejčastějších 100 hodnot ve sloupci.
- Komplexní: Komplexní vzorkování pracuje s velkou velikostí vzorku, aby poskytlo přesnější výsledky: Analyzuje se 100 000 řádků na tabulku a klasifikace vezme v úvahu všechny hodnoty na sloupec. Tato metoda je však časově náročná a náročná na prostředky.
- Vlastní: Definujte metodu vzorkování, velikost vzorku a základ pro klasifikaci sami:
Vyberte mezi sekvenčním a náhodným vzorkováním. Při sekvenčním vzorkování jsou první řádky datové sady vybrány v postupném pořadí. Při náhodném vzorkování jsou řádky, které mají být zahrnuty, náhodně vybrány. Pro obě metody je maximální počet řádků, které mají být vybrány, určen definovanou velikostí vzorku. Náhodné vzorkování je k dispozici pouze pro datová aktiva ze zdrojů dat, které podporují tento typ vzorkování.
Definujte maximální velikost vzorku. Můžete nastavit pevný počet řádků nebo určit, kolik procent řádků v datové sadě chcete analyzovat. Definujete-li velikost vzorku jako procentní hodnotu, můžete volitelně nastavit minimální a maximální počet řádků, které může ukázka obsahovat. Tyto hodnoty můžete nastavit v případě, že neznáte velikost datových sad, které mají být analyzovány. Počet nebo procentní část řádků vybraných pro vzorek může pouze přibližovat určenou hodnotu.
Pokud zdroj dat nepodporuje načtení skutečného počtu záznamů datové sady, je k dispozici pouze podmnožina voleb vzorkování.
Vyberte, zda chcete přiřadit datovou třídu na základě všech hodnot ve sloupci nebo na základě nejčastějších hodnot ve sloupci, kde můžete určit počet hodnot, které chcete vzít v úvahu.
Základní, střední nebo komplexní vzorkování je sekvenční a začíná v horní části tabulky. Chcete-li potlačit vzorkování, použijte vlastní vzorkování, které je nakonfigurováno s náhodným vzorkováním a velikostí vzorku 100%.
Definujte, zda chcete spustit naplánované úlohy obohacení. Pokud nenastavíte plán, spustíte obohacení, když uložíte aktivum obohacení metadat. Obohacení můžete kdykoli znovu spustit ručně.
Pokud vyberete spuštění obohacení podle specifického plánu, definujte datum a čas, kdy se má úloha spustit. Můžete naplánovat jednotlivá a opakující se spuštění. Pokud naplánujete jedno spuštění, úloha se spustí přesně jednou v uvedený den a čas. Pokud naplánujete opakující se spuštění, úloha se spustí poprvé s časovým razítkem uvedeným v sekci Opakovat.
Volitelně změňte název úlohy obohacení. Výchozí název je úloha metadata_obohacení .
Později můžete přistoupit k úloze obohacení, kterou vytvoříte, ze stránky Úlohy projektu. Tato stránka také poskytuje snadný přístup k protokolům úloh. Viz Úlohy.
Pokud váš rozsah dat zahrnuje aktiva importu metadat, stránka Plán také poskytuje informace o plánech příslušných úloh importu metadat. Tyto informace vám pomohou koordinovat váš plán obohacení s jakýmikoli plány importu.
Vyberte rozsah dat pro spuštění obohacení, ať už je naplánováno nebo spuštěno ručně. Rozsah dat může být všechna aktiva z vybraného rozsahu dat, nebo pouze nová nebo upravená aktiva. Nová nebo upravená aktiva znamenají aktiva, která byla přidána do rozsahu dat, kde byly přidány nebo odebrány sloupce a kde se popisy aktiv nebo sloupců změnily po posledním spuštění obohacení. Obohacení se vždy spustí na celém datovém aktivu bez ohledu na to, zda je aktivum nové nebo upravené.
Přezkoumejte konfiguraci obohacení metadat. Chcete-li provést změny, klepněte na ikonu Upravit () na dlaždici a aktualizujte nastavení.
Klepněte na volbu Vytvořit. Aktivum obohacení metadat se přidá do projektu a vytvoří se úloha obohacení metadat. Pokud jste nekonfigurovali plán, obohacení se spustí okamžitě. Pokud jste nakonfigurovali plán, bude obohacení spuštěno na definovaném plánu.
Po dokončení obohacení můžete získat přístup k vysokoúrovňovému přehledu výsledků obohacení zobrazením aktiva obohacení metadat. Odtud můžete přejít na podrobnější úroveň a pracovat s výsledky pro každé aktivum. Viz Práce s výsledky obohacení.
Chcete-li získat informace o tom, jak aktualizovat, znovu spustit nebo odstranit obohacení metadat, prohlédněte si téma Správa existujícího obohacení metadat.
Další informace
Další kroky
Nadřízené téma: Správa obohacení metadat