0 / 0
Go back to the English version of the documentation
Správa kvality dat
Last updated: 27. 10. 2023
Správa kvality dat

Měřte, monitorujte a udržujte kvalitu svých dat, abyste se ujistili, že data splňují vaše očekávání a standardy pro konkrétní případy použití.

Data dobré kvality jsou ve stavu, který lze obvykle definovat jako vhodná k použití, bez defektůnebo splňující očekávání a požadavky. Kvalita dat se měří vzhledem k rozměrům kvality Přesnost, úplnost, konzistence, včasnost, jedinečnosta Platnost.

Analýza kvality dat poskytuje odpovědi na tyto otázky:

  • Jak dobrá je celková kvalita datového aktiva?
  • Který z datových aktiv má lepší kvalitu?
  • Jak se kvalita datového aktiva v průběhu času měnila?
Nezbytné služby
Watson Knowledge Catalog
DataStage
Formát dat
Tabulky z relačních a nerelačních zdrojů dat
Tabulka: Avro, CSV, parkety, ORC:
Další informace naleznete v tématu Podporovaná připojení.
Velikost dat
Všechny:
Nezbytná oprávnění
Chcete-li zobrazit definice a pravidla kvality dat, musíte mít v projektu alespoň roli Prohlížeč .
Chcete-li vytvořit, upravit nebo odstranit definice a pravidla kvality dat, musíte mít v projektu roli Administrátor nebo Editor .

Analýza a monitorování kvality dat

Pomocí analýzy a monitorování kvality dat vyhodnoťte data podle specifických kritérií. Pomocí těchto hodnotících kritérií opakovaně v průběhu času zobrazte důležité změny v kvalitě ověřovaných údajů.

Po návrhu kontroly kvality dat máte tyto možnosti:

  • Vytvořte definici kvality dat, která definuje logiku kontroly dat bez ohledu na zdroj dat. Definice obsahuje logické proměnné nebo odkazy, které propojíte nebo svážete se skutečnými daty (například se zdrojem dat, tabulkou a sloupcem nebo spojenými tabulkami) při vytváření pravidla kvality dat, které lze provést.

    Po vytvoření pravidla kvality dat s požadovanými vazbami na základě vybrané definice kvality dat lze toto pravidlo provést. Pravidlo vytváří relevantní statistiku a může generovat výstupní tabulku v závislosti na konfiguraci pravidla.

  • Vytvořte pravidlo kvality dat založené na SQL.

Funkčnost pravidla kvality dat může být v rozsahu od jednoduchého testu s jedním sloupcem až po vyhodnocení více sloupců v rámci zdrojů dat i mezi nimi.

Hodnocení kvality údajů

Chcete-li určit, zda jsou vaše data kvalitní, zkontrolujte, jak daleko splňují vaše očekávání, a identifikujte anomálie v datech. Hodnocení kvality dat vám také pomůže porozumět struktuře a obsahu vašich dat.

Další informace

Nadřízené téma: Příprava dat

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more