0 / 0
Go back to the English version of the documentation
Aktiva kvality dat
Last updated: 27. 10. 2023
Aktiva kvality dat

Navrhněte aktiva kvality dat pro analýzu a monitorování kvality dat v projektu.

Ve svém projektu můžete mít následující aktiva kvality dat:

Než začnete vytvářet definice a pravidla kvality dat, zamyslete se nad následujícími tématy:

  • Co chcete analyzovat a monitorovat?
  • Které prvky je třeba vyhodnotit?
  • Jaký je cíl analýzy, jako je kontrola úplnosti, platnosti atd.?

Definice kvality údajů

Definice kvality dat představuje generickou formu pravidla kvality dat. Popisuje vyhodnocení pravidla nebo podmínku pomocí logických proměnných, které nejsou vázány na žádná skutečná data. Lze jej tedy použít v libovolném počtu pravidel kvality dat. Změníte-li definici kvality dat, změníte také logiku ověření pro všechna pravidla odvozená z definice.

V projektech vytváříte a spravujete definice kvality dat. Chcete-li definici kvality dat zpřístupnit pro opětovné použití v jiných projektech, můžete ji publikovat do katalogu.

Pravidla kvality údajů

Pravidlo kvality dat odkazuje nebo váže logické proměnné na skutečná data pro vyhodnocení. Pravidlo je spuštěno na fyzických datech, aby se posoudila kvalita vašich dat vyhodnocením a ověřením specifických podmínek. Každé spuštění pravidla poskytuje statistiku a informace o potenciálních výjimkách, jak jsou definovány pro výstupní tabulku pravidla.

V projektech vytváříte, spravujete a spouštíte pravidla kvality dat.

Můžete vytvořit pravidla z jedné nebo více definic kvality dat nebo můžete vytvořit pravidla kvality dat pomocí příkazů SQL. Pravidla sestavená z definic kvality dat zachycují, které sloupce jsou v souladu s podmínkami pravidla a které ne. Pravidla založená na SQL jsou vhodnější pro kontrolu nevyhovujících záznamů.

Chcete například ověřit daňové identifikátory. Takže vaše koncepce mohou být TaxID existuje a Ověřit TaxID.

Nyní máte tyto možnosti:

  • Vytvořte pravidla z definic kvality dat. U obou konceptů můžete vytvořit definici kvality dat s logikou vyhodnocení pro logickou proměnnou tax_id. První podmínkou je, že identifikátor daně (nebo TaxID) musí existovat, a druhou podmínkou je, že identifikátor daně musí splňovat definovaný formát.

    Definice kvality dat TaxID existuje: tax_id exists
    Definice kvality dat Ověřit TaxID: tax_id matches_format 'AA99-A999-9999'

    Poté vyberte jednu z těchto voleb:

    • Pro každý sloupec, který obsahuje identifikátor daně, který má být ověřen, definujte dvě pravidla kvality dat. První pravidlo sváže logickou proměnnou tax_id definice TaxID existuje se sloupcem. Druhé pravidlo váže logickou proměnnou tax_id definice Ověřit TaxID ke sloupci.
    • Pro každý sloupec obsahující identifikátor daně, který má být ověřen, definujte jedno pravidlo kvality dat a použijte v tomto pravidle obě definice kvality dat. Svažte logickou proměnnou tax_id v libovolné definici TaxID existuje a Ověřit TaxID se sloupcem.
    • Definujte jedno pravidlo kvality dat a použijte v tomto pravidle obě definice kvality dat. Vytvořte vazbu logické proměnné tax_id v jedné z definic TaxID existuje a Ověřit TaxID na sadu parametrů typu Parametr ze sloupce. Přidejte všechny sloupce obsahující identifikátor daně, který má být ověřen pro danou sadu parametrů.
  • Vytvořte pravidlo založené na SQL: select tax_id from taxschema.taxtable where tax_id is null or not regexp_like(tax_id, '^[a-zA-Z]{2}[0-9]{2}-[a-zA-Z][0-9]{3}-[0-9]{4}$')

Další informace

Nadřízené téma: Správa kvality dat

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more