0 / 0
Go back to the English version of the documentation
Informace o kvalitě dat pro datová aktiva
Last updated: 22. 8. 2023
Informace o kvalitě dat pro datová aktiva

Data jsou užitečná pouze v případě, že je její kvalita důvěryhodná a průběžně vyhodnocována. Na stránce Kvalita dat můžete monitorovat kvalitu dat datového aktiva.

Stejné informace, jako na kartě Kvalita dat , jsou k dispozici, když klepnete na skóre kvality dat v aktivu obohacení metadat.

Požadavky a omezení

Informace o kvalitě dat pro aktiva si můžete zobrazit za následujících okolností.

Požadovaná služba

Služba Watson Knowledge Catalog

Volitelné:
IBM Match 360 service for matching

Výstup kvality dat z pravidel kvality dat je k dispozici pouze v regionech Dallas a Frankfurt. Viz Regionální omezení pro Cloud Pak for Data as a Service.

Požadovaná oprávnění

Chcete-li zobrazit stránku Kvalita dat , můžete v pracovním prostoru mít libovolnou roli spolupracovníka.

Chcete-li změnit způsob výpočtu skóre nebo vytvořit nové kontroly kvality dat, musíte mít v projektu roli Administrátor nebo Editor .

Chcete-li zobrazit výstupní tabulky pravidel kvality dat, můžete mít v pracovním prostoru libovolnou roli spolupracovníka. Přístup může být blokován pravidly ochrany dat. Viz téma Vynucení pravidel ochrany dat.

Pracovní prostory

Informace o kvalitě dat si můžete prohlédnout v těchto pracovních prostorech:

  • Projekty
  • Katalogy
Typy aktiv

Tyto typy aktiv mají informace o kvalitě dat:

  • Datová aktiva z relačních nebo nerelačních databází z připojení ke zdrojům dat
  • Datová aktiva z rozdělených datových sad, kde se dělená datová sada skládá z více souborů a je reprezentována jedinou složkou odeslanou z lokálního systému souborů nebo ze souborových připojení ke zdrojům dat
  • Datová aktiva ze souborů odeslaných z lokálního systému souborů nebo z připojení založených na souborech ke zdrojům dat, s těmito formáty:
    • CSV
    • XLS, XLSM, XLSX (pouze první list v sešitu.)
    • TSV
    • avro
    • OČNÍ
    • parket
  • Datová aktiva entity IBM Match 360

Na stránce Kvalita dat najdete informace o kvalitě datového aktiva:

Zobrazí informace o kvalitě dat pro datové aktivum v projektu

  1. Celkové skóre kvality dat aktiva. Jedná se o vážený průměr skóre poskytovaných jeho sloupci. Další informace naleznete v tématu Skóre kvality dat.
  2. Skóre pro jednotlivé dimenze. Pro každou dimenzi se jedná o vážený průměr odpovídajících skóre dimenze poskytovaných jednotlivými kontrolami. Předdefinované kontroly kvality dat, které se spouštějí v rámci obohacení metadat, mají přiřazeny výchozí dimenze. Viz Předdefinované kontroly kvality dat. V případě pravidel kvality dat přiřadíte dimenze podle potřeby. Produkt IBM Match 360 poskytuje dimenzi Důvěra entit . Další informace naleznete v tématu Dimenze kvality dat a Skóre kvality dat.
  3. Informace o trendu, které ukazují, jak se celková kvalita nebo skóre kvality u dimenze změnily za 30, 90 nebo 180 dní. Další informace naleznete v tématu Výsledky analýzy kvality dat.
  4. Seznam kontrol kvality dat, které byly použity na aktivum a jejich výsledky. Další informace naleznete v tématu Výsledky analýzy kvality dat.
  5. Informace o kvalitě dat pro jednotlivé sloupce. Další informace naleznete v tématu Výsledky analýzy kvality dat.

Stránka kvality dat v projektech

Stránka Kvalita dat se naplní daty po spuštění první kontroly kvality dat na datovém aktivu jedním z těchto způsobů:

  • Analýza kvality dat se spouští na aktivu jako součást obohacení metadat.
  • Pravidlo kvality dat se spustí na aktivu.
  • Připojený datový aktivum entity IBM Match 360 je přidán.

Když je aktivum naimportováno z katalogu, zkopírují se do projektu pouze informace o profilu. Informace o kvalitě dat se nezkopírují.

Skóre kvality se přepočte a data na této stránce se obnoví v těchto případech:

  • Analýza kvality dat se spouští v kontextu obohacení metadat.
  • Pravidla kvality dat se spouštějí na aktivu.
  • Pravidlo kvality dat, které přispělo k skóre, je odstraněno. Všechny problémy, které byly vráceny tímto pravidlem kvality dat, budou odebrány.
  • Profil aktiva se odstraní na stránce Profil aktiva. Všechny problémy, které byly vráceny předem definovanými kontrolami kvality dat, jsou odebrány.
  • Aktivum dat entity IBM Match 360 je aktualizováno, například je vyladěn odpovídající algoritmus nebo problémy s odpovídající potenciální shodou jsou napraveny.

Celkové skóre a skóre rozměru se také aktualizuje pokaždé, když změníte nastavení Přispívání k celkovému skóre pro kontrolu nebo sloupec. Další informace naleznete v tématu Skóre kvality dat.

Okamžitě můžete zjistit, kdy byly výsledky kvality naposledy aktualizovány.

V sekci Kontrola kvality dat si můžete prohlédnout následující informace:

  • Které kontroly byly spuštěny na aktivu, seřazené podle data s posledními kontrolami nahoře
  • Do které dimenze je každá kontrola vázána.
  • Zda byla kontrola použita na celé aktivum nebo na sloupce v aktivu
  • Informace o počtu nalezených problémů
  • Jaký druh odběru vzorků byl použit v případě, že
  • Skóre kvality dat, které byla generována kontrola
  • Zda se skóre kvality dat při kontrole bere v úvahu při výpočtu celkového skóre aktiva a skóre dimenze
  • Kdy byla kontrola naposledy spuštěna

Můžete přejít na výsledky každé kontroly s výjimkou shody pro produkt IBM Match 360 . Jako administrátor projektu nebo editor můžete pro každou kontrolu změnit, zda přispívá k celkovému skóre kvality dat, a můžete vytvořit nové kontroly kvality dat. Další informace naleznete v tématu Výsledky analýzy kvality dat.

Můžete přepínat mezi pohledem Kontroly a pohledem Sloupce . Sekce Přehled sloupců zobrazuje následující informace pro každý sloupec, který byl předmětem jakékoli kontroly kvality dat:

  • Název sloupce
  • Skóre kvality sloupce pro kteroukoli z dimenzí, které jsou použitelné pro aktivum
  • Počet kontrol, které byly spuštěny na sloupci
  • Zda je skóre kvality údajů ve sloupci zvažované ve výpočtu celkového skóre aktiva a skóre dimenze
  • Kdy byl sloupec naposledy zkontrolován

Poté můžete přejít na podrobné informace o kvalitě dat pro každý sloupec. Jako administrátor nebo editor projektu můžete také změnit pro každý sloupec, zda jeho skóre kvality přispívá k celkovému skóre kvality dat. Další informace naleznete v tématu Výsledky analýzy kvality dat.

Stránka kvality dat v katalozích

Stránka Kvalita dat je na počátku naplněna daty, když jsou do katalogu publikovány datové aktivum, které má informace o kvalitě dat. Stránka je prázdná pro jakékoli aktivum, které jste přímo přidali jako připojené aktivum, nebo které jste odeslali z lokálního systému souborů. Chcete-li generovat informace o kvalitě dat pro tato aktiva, přidejte je do projektu a spusťte pro aktiva pravidla pro obohacení metadat nebo pravidla kvality dat. Poté je publikujte do katalogu.

Skóre kvality se aktualizují a data na této stránce se aktualizují pokaždé, když je aktivum publikováno z projektu s novými informacemi o kvalitě dat.

Okamžitě můžete zjistit, kdy byly výsledky kvality naposledy aktualizovány.

Sekce Kontroly kvality dat a Přehled sloupců poskytují stejné informace jako karta Kvalita dat v projektu. Podrobnosti však nelze ponoření do kontroly nebo podrobností sloupců.

Další informace

Nadřízené téma: Typy a vlastnosti aktiv

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more