0 / 0
Go back to the English version of the documentation
Profily datových aktiv
Last updated: 06. 7. 2023
Profily datových aktiv

Profil aktiva zahrnuje generované informace a statistiku o obsahu aktiva. Profil se zobrazí na stránce Profil aktiva.

Požadavky a omezení

Profil aktiv si můžete prohlédnout za následujících okolností.

Požadovaná oprávnění

Chcete-li zobrazit stránku Profil datového aktiva, můžete mít jakoukoli roli v projektu nebo katalogu.

Chcete-li vytvořit nebo aktualizovat profil, musíte mít v projektu nebo katalogu roli Administrátor nebo Editor .

Pracovní prostory

Profil aktiva si můžete prohlédnout v projektech.

Typy aktiv

Tyto typy aktiv mají profil:

  • Datová aktiva z relačních nebo nerelačních databází z připojení ke zdrojům dat, s výjimkou Cloudant

  • Datová aktiva z rozdělených datových sad, kde se dělená datová sada skládá z více souborů a je reprezentována jedinou složkou odeslanou z lokálního systému souborů nebo ze souborových připojení ke zdrojům dat

  • Datová aktiva ze souborů odeslaných z lokálního systému souborů nebo z připojení založených na souborech ke zdrojům dat, s těmito formáty:

    • CSV
    • XLS, XLSM, XLSX (profilován je pouze první list v sešitu.)
    • TSV
    • avro
    • parket

    Strukturované datové soubory však nejsou profilovány, když se datová aktiva výslovně neodkazují na ně, jako je například za těchto okolností:

    • Soubory jsou v rámci připojeného aktiva složky. K souborům, které jsou přístupné z připojeného aktiva složky, se nezachází jako s aktivy a nejsou profilovány.
    • Soubory se nacházejí v archivním souboru. Archivní soubor je odkazován datovým aktivem a komprimované soubory nejsou profilovány.

Vytváření profilu

V projektech můžete vytvořit profil pro datové aktivum klepnutím na volbu Vytvořit profil. Při změně dat můžete aktualizovat existující profil.

Výsledky profilování

Když vytvoříte nebo aktualizujete profil aktiva, budou analyzovány sloupce v datovém aktivu. Standardně je profil vytvořen na základě prvních 5000 řádků dat. Má-li datové aktivum více než 250 sloupců, profil se vytvoří na základě prvních 1 000 řádků dat.

Profil datového aktiva zobrazuje informace o každém sloupci v datové sadě:

  • Kdy byl profil vytvořen nebo naposledy aktualizován.
  • Počet sloupců a řádků, které byly analyzovány.
  • Datové typy pro sloupce a rozdělení datových typů.
  • Formáty dat pro sloupce a distribuce formátů.
  • Procentní část shody, chybné shody nebo chybějící data pro každý sloupec.
  • Distribuce frekvence pro všechny hodnoty uvedené ve sloupci.
  • Statistika o datech pro každý sloupec:
    • Počet hodnot distinct označuje, kolik různých hodnot existuje v datech vzorku pro sloupec.
    • Procento jedinečných hodnot označuje procentní podíl odlišných hodnot, které se objevují pouze jednou ve sloupci.
    • Minimální, maximální nebo střední hodnota a někdy směrodatná odchylka v daném sloupci. V závislosti na datovém formátu sloupce se statistiky mírně liší. Například statistiky pro sloupec datového typu integer mají minimální, maximální a střední hodnoty a směrodatnou odchylku, zatímco statistika sloupce datového typu má minimální délku, maximální délku a střední hodnoty délky.

Nadřízené téma: Typy a vlastnosti aktiv

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more