0 / 0
Go back to the English version of the documentation
Ověření platnosti vašich dat v Data Refinery
Last updated: 06. 7. 2023
Ověření platnosti vašich dat v Data Refinery

Kdykoli poté, co jste přidali data do Data Refinery, můžete data ověřit. Obvykle se to bude chtít provést ve více bodech v procesu upřesnění.

Chcete-li ověřit data:

  1. V sekci Data Refineryklepněte na kartu Profil .

  2. Zkontrolujte metriky pro každý sloupec.

  3. Proveďte odpovídající akce, jak je popsáno v následujících sekcích, v závislosti na tom, co se naučíte.

Frekvence

Frekvence je počet případů, kdy se vyskytne hodnota nebo hodnota v uvedeném rozsahu. Každá distribuce frekvence (sloupec) zobrazuje počet jedinečných hodnot ve sloupci.

Přezkoumejte distribuční frekvenci a vyhledejte anomálie ve vašich datech. Chcete-li vyčistit data z těchto anomálií, jednoduše odeberte hodnoty.

Pro sloupce typu Integer a Date/Time můžete upravit počet přihrádek (seskupení), které chcete zobrazit. Ve výchozím zobrazení s více sloupci je maximum 20. Rozbalíte-li řádek frekvenčního grafu, bude maximum 50.

Statistika

Statistika je kolekcí kvantitativních dat. Statistika pro každý sloupec zobrazuje minimum, maximum, střední hodnotu a počet jedinečných hodnot v daném sloupci.

V závislosti na datovém typu sloupce se budou statistické údaje pro každý sloupec mírně lišit. Například statistika pro sloupec datového typu integer má minimální, maximální a střední hodnotu, zatímco statistika pro sloupec datového typu řetězec má minimální délku, maximální délku a střední hodnoty délky.

Nadřízené téma: Upřesnění dat

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more