0 / 0
Go back to the English version of the documentation
Přezkoumání výsledků obohacení metadat (Watson Knowledge Catalog)
Last updated: 29. 9. 2023
Přezkoumání výsledků obohacení metadat (Watson Knowledge Catalog)

Přezkoumejte výsledky obohacení po dokončení úlohy obohacení. Přistupte k výsledkům zobrazením aktiva obohacení metadat.

Nezbytná oprávnění
Chcete-li zobrazit výsledky obohacení, musíte mít v projektu alespoň roli Prohlížeč .
Chcete-li upravit výsledky, musíte mít v projektu alespoň roli Editor . Chcete-li změnit přiřazení výrazů, musíte mít také alespoň přístup pro zobrazení ke kategoriím, které se používají v obohacení.

Aktiva obohacení metadat jsou uvedena v sekci Obohacení metadat na stránce projektu Aktiva . Chcete-li zobrazit aktivum obohacení metadat, klepněte na jeho název nebo klepněte na volbu Zobrazit v nabídce přetečení aktiva.

Postranní panel poskytuje souhrn relevantních informací o obohacení metadat.

Přezkoumání výsledků na úrovni aktiva

Na kartě Aktiva jsou pro každé datové aktivum v rozsahu obohacení metadat poskytnuty následující informace:

  • Název aktiva.
  • Informace o zdroji.
  • Přiřazené obchodní podmínky a počet navrhovaných podmínek.
  • Celkové skóre kvality dat dosažené v posledním obohacení.
  • Stav přezkoumání.
  • Stav a datum a čas posledního obohacení.
  • Stav publikování.

Dokud se obohacení nespustilo alespoň jednou, jsou naplněny pouze sloupce Název a Kontext .

Zkontrolujte podrobnosti aktiva a výsledky obohacení:

Na sloupce jednotlivých aktiv můžete přejít přímo klepnutím na název aktiva nebo klepnutím na volbu Zobrazit sloupce z nabídky přetečení (akce ikona tři svislé tečky).

Podrobné výsledky pro každé aktivum jsou také k dispozici v jeho profilu aktiva v projektu. K podrobnostem profilu na úrovni sloupce lze přistupovat také z karty Regulace na panelu podrobností sloupce.

Chcete-li odebrat specifické aktivum z rozsahu obohacení, vyberte aktivum a klepněte na volbu Odebrat aktivum z nabídky přetečení.

Podrobnosti aktiva a obohacení

Přistupte k podrobnostem aktiva a obohacení klepnutím na název aktiva nebo klepnutím na volbu Zobrazit podrobnosti aktiva z nabídky přetečení. Na kartě Podrobnosti v postranním panelu najdete tyto informace:

  • Zdroj datového aktiva: připojení a databáze pro připojená aktiva. Pro soubory odeslané z lokálního systému se ve sloupci Zdroj zobrazí Projekt .
  • Počet sloupců a řádků v aktivu a jeho datový formát.
  • Vlastník aktiva. Vlastník aktiva je obvykle uživatel, který přidal aktivum do projektu, s výjimkou aktiv, která byla přidána z katalogu. V tomto případě je vlastníkem aktiva katalogu také vlastník aktiva projektu.
  • Vybrané volby obohacení.
  • Podrobnosti vzorkování.
  • Seznam souvisejících aktiv, jako např. aktivum importu metadat, které obsahuje vybrané aktivum.
  • Datum, kdy bylo aktivum naposledy obohaceno, stejně jako informace o spuštění úlohy a odkaz na úlohu obohacení.
  • Popis aktiva.

Informace o řízení

Přístup k informacím o řízení pro aktivum klepnutím na název aktiva, klepnutím na odkaz Zobrazit více ve sloupci Obchodní podmínky nebo klepnutím na volbu Zobrazit podrobnosti aktiva z nabídky přetečení. Na kartě Regulace v postranním panelu můžete spravovat přiřazení termínů.

Přezkoumejte přiřazené a navrhované podmínky. Pro každý přiřazený nebo navrhovaný termín se zobrazí skóre spolehlivosti. Klepnutím na výraz můžete zobrazit některé jeho vlastnosti: popis, primární a sekundární kategorie, seznam datových stevardů, vztahy hierarchického typu a související klasifikace a datové třídy.

Podle potřeby přijměte návrhy. Můžete také vyhledat obchodní výrazy, které nejsou uvedeny jako návrhy, a přiřadit je ručně. Odeberte všechny přiřazené výrazy, které považujete za nepřesné. Taková negativní zpětná vazba se zvažuje v dalším běhu obohacení. S výrazy, které odeberete hromadně, se zachází odlišně od těch, které odebírejte jednotlivě. Pokud odeberete podmínku z jednoho aktiva, je tato podmínka považována za zamítnutou. Je také uveden v postranním panelu a můžete jej kdykoli znovu přiřadit. Další informace viz Přiřazení výrazů.

Skóre kvality dat

Skóre kvality dat se zobrazí pouze v případě, že byla pro aktivum použita alespoň jedna kontrola kvality dat. Jinak se zobrazí pomlčka (-). Skóre zobrazené pro datové aktivum je vážený průměr skóre poskytnutých sloupci v datovém aktivu. Skóre kvality dat, která jsou pod zadanou prahovou hodnotou, jsou označena červenou tečkou. Skóre kvality dat, která se rovnají nebo překračují uvedenou prahovou hodnotu, jsou označena zeleně.

Hodnota rozdílových dat ukazuje, jak se celkové skóre kvality dat změnilo v porovnání se skóre z 90 dnů před nejnovější analýzou:

  • Zelená šipka ukazující vpravo nahoře (šipka směřující do pravého horního rohu) označuje, že skóre kvality dat vyšlo nahoru.
  • Červená šipka ukazující vpravo dole (šipka směřující vpravo dole) označuje, že se skóre kvality dat snížilo.

Chcete-li rychle vyhledat aktiva s problémy s kvalitou, zvláště když je rozsah obohacení velký, můžete filtrovat seznam podle skóre kvality.

Chcete-li získat podrobnosti o problémech s kvalitou dat, vyberte aktivum a klepněte na volbu Zobrazit podrobnosti o kvalitě dat z nabídky přetečení, nebo klepněte na skóre kvality.

Další informace viz Výsledky analýzy kvality dat a skóre kvality dat.

Stav přezkoumání

Na počátku je stav přezkoumání všech aktiv v obohacení metadat Nepřezkoumáno. Poté, co přezkoumáte výsledky obohacení pro aktivum v profilu aktiva, můžete nastavit stav přezkoumání aktiva na Přezkoumáno. Proto si všichni členové týmu uvědomují, na co se již podívali a co je ještě třeba přezkoumat. Pokud později provedené obohacení aktualizuje výsledky aktiva se stavem Přezkoumáno, stav přezkoumání aktiva se nastaví na Znovu analyzováno po přezkoumání.

Filtrujte seznam aktiv podle stavu přezkoumání, abyste rychle našli všechna aktiva, která je třeba prohlédnout.

Stav přezkoumání aktiva můžete kdykoli resetovat. Chcete-li změnit stav přezkoumání, klepněte v nabídce přetečení aktiva na volbu Označit jako přezkoumané nebo Označit jako nepřezkoumané . Chcete-li změnit stav přezkoumání několika aktiv najednou, vyberte aktiva, klepněte na volbu Vícea vyberte volbu Označit jako přezkoumané nebo Označit jako nepřezkoumané. Stav přezkoumání aktiva je nezávislý na tom, jaký stav přezkoumání mají jeho sloupce. Můžete také použít rozhraní API místo uživatelského rozhraní, abyste nastavili stav přezkoumání aktiv. Odkazy na tato rozhraní API jsou uvedeny v části Další informace .

Když provedete hromadnou změnu stavu revize, můžete vidět zprávu o úspěchu před tím, než se změny skutečně dokončí, v závislosti na objemu požadovaných změn. Možná budete muset zobrazení několikrát aktualizovat, než uvidíte všechny použité změny.

Stav obohacení

Sloupec stavu obohacení může mít tyto hodnoty:

Neanalyzováno
Toto aktivum bylo přidáno po posledním spuštění obohacení.
Dokončeno
Obohacení pro toto aktivum je dokončeno. Tento stav se také zobrazí, pokud se obohacení stalo mimo aktuální aktivum obohacení, například pokud bylo aktivum profilováno ručně před jeho přidáním do tohoto obohacení.
Nezdařený
Během obohacování došlo k chybě.
Zrušený
Spuštění úlohy pro obohacení bylo zrušeno.

Seznam výsledků můžete řadit nebo filtrovat podle stavu obohacení. Pro řazení je primární pořadí řazení podle stavu. Vzestupné pořadí je zrušeno, selhalo a dokončeno. V závislosti na obecném pořadí řazení jsou aktiva se stavem Neanalyzováno zobrazena neseřazená na začátku nebo na konci seznamu.

Stav publikování

Tento sloupec zobrazuje, zda bylo aktivum publikováno do katalogu. Podrobnosti publikování, jako např. cílový katalog nebo název publikační úlohy, jsou k dispozici v informacích o aktivu na postranním panelu.

Zobrazí se však pouze podrobnosti posledního požadavku na publikování.

Přezkoumání výsledků na úrovni sloupce

Na kartě Sloupce jsou pro každý sloupec v datovém aktivu v rozsahu obohacení metadat poskytnuty následující informace:

  • Název sloupce.
  • Tabulka, do které sloupec patří, a kontext aktiva.
  • Přiřazené obchodní podmínky a počet navrhovaných podmínek.
  • Přiřazená datová třída.
  • Skóre kvality dat pro tento sloupec.
  • Stav přezkoumání.

Karta Sloupce je prázdná, dokud se obohacení alespoň jednou nespustilo.

Chcete-li zkontrolovat pouze sloupce specifického datového aktiva, klepněte na název aktiva na kartě Aktiva nebo klepněte na volbu Zobrazit sloupce v nabídce přetečení (akce ikona tři svislé tečky).

Zkontrolujte podrobnosti sloupce a výsledky obohacení:

Podrobnosti sloupce

Přistupte k podrobnostem sloupce a obohacení klepnutím na název sloupce nebo klepnutím na volbu Zobrazit podrobnosti sloupce z nabídky přetečení. Na kartě Podrobnosti v postranním panelu najdete tyto informace:

  • Popis sloupce, je-li k dispozici.

  • Kontext aktiva, ke kterému sloupec náleží, v sekci Zdroj .

  • Hodnoty sloupce v ukázkových řádcích.

  • Datový formát sloupců v ukázkových řádcích.

  • Rozdělení frekvence nalezených hodnot a počet chybějících hodnot.

  • Statistiky o datech pro každý sloupec, jako je například počet různých hodnot, procento jedinečných hodnot, minimum, maximum nebo střední hodnota, a někdy směrodatná odchylka v tomto sloupci. Počet odlišených hodnot označuje, kolik různých hodnot existuje v ukázkových datech pro sloupec. Procentní část jedinečných hodnot označuje procentní část odlišených hodnot, které se ve sloupci objevují pouze jednou.

    V závislosti na datovém formátu sloupce se statistiky mírně liší. Například statistika pro sloupec datového typu integer má minimální, maximální a střední hodnoty a hodnotu směrodatné odchylky, zatímco statistika pro sloupec datového typu string má minimální délku, maximální délku a střední délku.

  • Vlastník aktiva.

Podrobnější výsledky pro každý sloupec jsou k dispozici v profilu sloupce. Chcete-li zobrazit tento profil, postupujte takto:

  • V nabídce přetečení sloupce vyberte volbu Zobrazit datový profil .
  • Klepněte na ikonu Otevřít profil sloupce ikona otevřít profil sloupce vedle položky Statistika nebo Formáty v podrobnostech sloupce.
  • Klepněte na odkaz Zobrazit vše v sekci Statistika nebo Formáty . Zda je tento odkaz k dispozici v závislosti na počtu výsledků.

Pokud se na sloupec vztahuje pravidlo ochrany dat, je k dispozici pouze podmnožina těchto informací: popis a kontext.

Informace o řízení

Přístup k informacím o řízení pro sloupec získáte klepnutím na název sloupce, klepnutím na odkaz Zobrazit více ve sloupci Obchodní podmínky nebo Třída dat nebo klepnutím na volbu Zobrazit podrobnosti sloupce z nabídky přetečení. Na kartě Regulace v postranním panelu můžete spravovat přiřazení termínů a datových tříd.

  • Přezkoumejte přiřazené a navrhované podmínky. Pro každý přiřazený nebo navrhovaný termín se zobrazí skóre spolehlivosti. Klepnutím na termín můžete zobrazit některé jeho vlastnosti: popis, primární a sekundární kategorie, seznam datových stevardů, vztahy hierarchického typu a související klasifikace a třídy dat.

    Podle potřeby přijměte návrhy. Můžete také vyhledat obchodní výrazy, které nejsou uvedeny jako návrhy, a přiřadit je ručně. Odeberte všechny přiřazené výrazy, které považujete za nepřesné. Taková negativní zpětná vazba se zvažuje v dalším běhu obohacení. S výrazy, které odeberete hromadně, se zachází odlišně od těch, které odebírejte jednotlivě. Pokud odeberete výraz z jednoho sloupce, bude tento výraz považován za odmítnutý. Je také uveden v postranním panelu a můžete jej kdykoli znovu přiřadit. Další informace viz Přiřazení výrazů.

    Všimněte si, že přiřazení termínů neovlivní přiřazení datových tříd. Pokud je výraz, který je přidružen ke třídě dat, přiřazen ke sloupci pomocí modelu ML nebo prostřednictvím porovnávání názvů, není automaticky přiřazena ani související třída dat.

  • Přezkoumejte přiřazenou datovou třídu a navrhované datové třídy. Klepnutím na datovou třídu můžete zobrazit některé její vlastnosti: popis, primární a sekundární kategorie, typ porovnávání dat, nadřízené a závislé datové třídy a související klasifikace a datové třídy.

    Skóre hodnověrnosti pro přiřazení nebo navržení datové třídy musí být alespoň stejné jako nastavená prahová hodnota. Viz Nastavení přiřazení datové třídy. Je-li prahová hodnota nastavena přímo na datové třídě, má tato prahová hodnota přednost při přiřazení datových tříd. To se nepovažuje za návrhy. Kromě skóre spolehlivosti se bere v úvahu i priorita datové třídy. Viz Přidání dat odpovídajících datovým třídám.

    Podrobnosti o datových třídách viz Datové třídy a Předdefinované datové třídy.

    Pomlčka (-) označuje, že během analýzy nebyla přiřazena žádná datová třída.

    Několik tříd dat je více generických identifikátorů, které jsou zjištěny a přiřazeny pouze na úrovni sloupce. Tyto třídy dat jsou přiřazeny, když nelze na úrovni hodnoty identifikovat specifičtější třídu dat. Generické identifikátory zahrnují následující datové třídy: kód, datum, identifikátor, indikátor, množství a text.

    Když přiřadíte třídu dat ručně, buď navrhovanou, nebo zcela odlišnou třídu dat, podmínky, které jsou přidruženy k této třídě dat, jsou přiřazeny v příštím spuštění obohacení. Přiřazení termínů však neznamená automatické přiřazení přidružených datových tříd.

Stejné informace jsou poskytnuty, když klepnete na odkaz Zobrazit více , který se zobrazí pod třídou dat nebo obchodním termínem, když podržíte ukazatel myši nad specifickým sloupcem.

Skóre kvality dat

Skóre kvality dat se zobrazí pouze v případě, že pro sloupec byla použita alespoň jedna kontrola kvality dat. Jinak se zobrazí pomlčka (-). Skóre kvality dat se vypočítávají pro každý jednotlivý sloupec v datovém aktivu na základě výsledků použitých kontrol kvality dat. Nastavení ve výsledcích analýzy kvality dat určuje, zda se má při výpočtu celkového skóre aktiv a dimenzí brát v úvahu jádro kvality sloupce.

Hodnota rozdílových dat ukazuje, jak se skóre kvality dat změnilo v porovnání se skóre z 90 dnů před nejnovější analýzou:

  • Zelená šipka ukazující vpravo nahoře (šipka směřující do pravého horního rohu) označuje, že skóre kvality dat vyšlo nahoru.
  • Červená šipka ukazující vpravo dole (šipka směřující vpravo dole) označuje, že se skóre kvality dat snížilo.

Chcete-li rychle vyhledat sloupce s problémy s kvalitou, zvláště když je rozsah obohacení velký, můžete filtrovat seznam podle skóre kvality.

Chcete-li získat podrobnosti o problémech s kvalitou dat, vyberte sloupec a klepněte na volbu Zobrazit podrobnosti o kvalitě dat v nabídce přetečení nebo klepněte na skóre kvality sloupce.

Další informace viz Výsledky analýzy kvality dat a skóre kvality dat.

Stav přezkoumání

Na počátku je stav revize všech sloupců v obohacení metadat Nepřezkoumáno. Po přezkoumání výsledků obohacení pro sloupec můžete nastavit jeho stav přezkoumání na Přezkoumáno. Proto si všichni členové týmu uvědomují, na co se již podívali a co je ještě třeba přezkoumat. Pokud později provedené obohacení aktualizuje výsledky aktiva se stavem Přezkoumáno, stav přezkoumání aktiva se nastaví na Znovu analyzováno po přezkoumání.

Stav revize sloupce můžete kdykoli resetovat. Chcete-li změnit stav revize, klepněte v nabídce přetečení sloupce na volbu Označit jako přezkoumané nebo Označit jako nepřezkoumané . Chcete-li změnit stav revize několika sloupců najednou, vyberte sloupce, klepněte na volbu Vícea vyberte volbu Označit jako přezkoumané nebo Označit jako nepřezkoumané. Stav přezkoumání sloupce je nezávislý na stavu přezkoumání, který obsahuje aktivum. K nastavení stavu revize sloupců můžete také použít rozhraní API namísto uživatelského rozhraní. Odkazy na tato rozhraní API jsou uvedeny v části Další informace .

Když provedete hromadnou změnu stavu revize, můžete vidět zprávu o úspěchu před tím, než se změny skutečně dokončí, v závislosti na objemu požadovaných změn. Možná budete muset zobrazení několikrát aktualizovat, než uvidíte všechny použité změny.

Pokud se používá vestavěný model strojového učení pro přiřazení termínů založených na jazyku ML a je trénován z aktiv projektu, sloupce, které jsou označeny jako přezkoumané a mají automaticky přiřazené obchodní termíny, slouží jako trénovací data.

Filtrujte seznam sloupců podle stavu revize, abyste rychle nalezli všechny sloupce, které je třeba prohlédnout.

Další krok

Další informace

Nadřízené téma: Správa obohacení metadat

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more