Perfiles de activos de datos
Un perfil de activo incluye información generada y estadísticas sobre el contenido del activo. Puede ver el perfil en la página Perfil de un activo.
Requisitos y restricciones
Puede ver el perfil de activos en las circunstancias siguientes.
Permisos necesarios
Para ver la página Perfil de un activo de datos, puede tener cualquier rol en un proyecto.
Para crear o actualizar un perfil, debe tener el rol Admin o Editor en el proyecto.
Espacios de trabajo
Puede ver el perfil de activo en proyectos.
Tipos de activos
Estos tipos de activos tienen un perfil:
Activos de datos de bases de datos relacionales o no relacionales desde una conexión a los orígenes de datos, excepto Cloudant
Activos de datos de conjuntos de datos particionados, donde un conjunto de datos particionados consta de varios archivos y está representado por una única carpeta cargada desde el sistema de archivos local o desde conexiones basadas en archivos a los orígenes de datos
Activos de datos de archivos cargados desde el sistema de archivos local o desde conexiones basadas en archivo a los orígenes de datos, con estos formatos:
- CSV
- XLS, XLSM, XLSX (solo se ha perfilado la primera hoja de un libro de trabajo).
- TSV
- Avro
- Parquet
Sin embargo, los archivos de datos estructurados no se perfilan cuando los activos de datos no hacen explícitamente referencia a los mismos, como en estos casos:
- Los archivos están dentro de un activo de carpeta conectado. Los archivos a los que se puede acceder desde un activo de carpeta conectado no se tratan como activos y no se perfilan.
- Los archivos están dentro de un archivo de archivador. El activo de datos hace referencia al archivo de archivador sin que se perfilen los archivos comprimidos.
Creación de un perfil
En proyectos, puede crear un perfil para un activo de datos pulsando Crear perfil. Puede actualizar un perfil existente cuando cambien los datos.
Resultados de perfilado
Cuando crea o actualiza un perfil de activo, se analizan las columnas del activo de datos. De forma predeterminada, el perfil se crea basándose en las primeras 5.000 filas de datos. Si el activo de datos tiene más de 250 columnas, el perfil se crea basándose en las primeras 1.000 filas de datos.
El perfil de un activo de datos muestra información sobre cada columna del conjunto de datos:
- Cuándo se ha creado el perfil o se ha actualizado por última vez.
- Cuántas columnas y filas se han analizado.
- Los tipos de datos para la distribución de columnas y tipos de datos.
- Los formatos de datos para la distribución de columnas y formatos.
- Porcentaje de datos coincidentes, no coincidentes o que faltan para cada columna.
- La distribución de frecuencias para todos los valores identificados en una columna.
- Estadísticas sobre los datos de cada columna:
- El número de valores distinct indica cuántos valores diferentes existen en los datos muestreados para la columna.
- El porcentaje de valores exclusivos indica el porcentaje de valores distintos que aparecen sólo una vez en la columna.
- El mínimo, el máximo o la media, y a veces la desviación estándar en esa columna. En función del formato de datos de una columna, las estadísticas varían ligeramente. Por ejemplo, las estadísticas para una columna de tipo de datos entero tienen valores mínimo, máximo y medio y un valor de desviación estándar, mientras que las estadísticas para una columna de tipo de datos serie tienen valores de longitud mínima, longitud máxima y longitud media.
Tema padre: Tipos de activos y propiedades