Translation not up to date
Profil aktiva zahrnuje generované informace a statistiku o obsahu aktiva. Profil se zobrazí na stránce Profil aktiva.
Požadavky a omezení
Profil aktiv si můžete prohlédnout za následujících okolností.
- Požadovaná oprávnění
Chcete-li zobrazit stránku Profil datového aktiva, můžete mít jakoukoli roli v projektu nebo katalogu.
Chcete-li vytvořit nebo aktualizovat profil, musíte mít v projektu nebo katalogu roli Administrátor nebo Editor .
- Pracovní prostory
Profil aktiva si můžete prohlédnout v projektech.
- Typy aktiv
Tyto typy aktiv mají profil:
Datová aktiva z relačních nebo nerelačních databází z připojení ke zdrojům dat, s výjimkou Cloudant
Datová aktiva z rozdělených datových sad, kde se dělená datová sada skládá z více souborů a je reprezentována jedinou složkou odeslanou z lokálního systému souborů nebo ze souborových připojení ke zdrojům dat
Datová aktiva ze souborů odeslaných z lokálního systému souborů nebo z připojení založených na souborech ke zdrojům dat, s těmito formáty:
- CSV
- XLS, XLSM, XLSX (profilován je pouze první list v sešitu.)
- TSV
- avro
- parket
Strukturované datové soubory však nejsou profilovány, když se datová aktiva výslovně neodkazují na ně, jako je například za těchto okolností:
- Soubory jsou v rámci připojeného aktiva složky. K souborům, které jsou přístupné z připojeného aktiva složky, se nezachází jako s aktivy a nejsou profilovány.
- Soubory se nacházejí v archivním souboru. Archivní soubor je odkazován datovým aktivem a komprimované soubory nejsou profilovány.
Vytváření profilu
V projektech můžete vytvořit profil pro datové aktivum klepnutím na volbu Vytvořit profil. Při změně dat můžete aktualizovat existující profil.
Výsledky profilování
Když vytvoříte nebo aktualizujete profil aktiva, budou analyzovány sloupce v datovém aktivu. Standardně je profil vytvořen na základě prvních 5000 řádků dat. Má-li datové aktivum více než 250 sloupců, profil se vytvoří na základě prvních 1 000 řádků dat.
Profil datového aktiva zobrazuje informace o každém sloupci v datové sadě:
- Kdy byl profil vytvořen nebo naposledy aktualizován.
- Počet sloupců a řádků, které byly analyzovány.
- Datové typy pro sloupce a rozdělení datových typů.
- Formáty dat pro sloupce a distribuce formátů.
- Procentní část shody, chybné shody nebo chybějící data pro každý sloupec.
- Distribuce frekvence pro všechny hodnoty uvedené ve sloupci.
- Statistika o datech pro každý sloupec:
- Počet hodnot distinct označuje, kolik různých hodnot existuje v datech vzorku pro sloupec.
- Procento jedinečných hodnot označuje procentní podíl odlišných hodnot, které se objevují pouze jednou ve sloupci.
- Minimální, maximální nebo střední hodnota a někdy směrodatná odchylka v daném sloupci. V závislosti na datovém formátu sloupce se statistiky mírně liší. Například statistiky pro sloupec datového typu integer mají minimální, maximální a střední hodnoty a směrodatnou odchylku, zatímco statistika sloupce datového typu má minimální délku, maximální délku a střední hodnoty délky.
Nadřízené téma: Typy a vlastnosti aktiv