Puede ver el perfil de activos en las circunstancias siguientes.
Permisos necesarios
Copy link to section
Para ver la página Perfil de un activo de datos, puede tener cualquier rol en un proyecto.
Para crear o actualizar un perfil, debe tener el rol Admin o Editor en el proyecto.
Espacios de trabajo
Copy link to section
Puede ver el perfil de activo en proyectos.
Tipos de activos
Copy link to section
Estos tipos de activos tienen un perfil:
Activos de datos de bases de datos relacionales o no relacionales desde una conexión a los orígenes de datos, excepto Cloudant
Activos de datos de conjuntos de datos particionados, donde un conjunto de datos particionados consta de varios archivos y está representado por una única carpeta cargada desde el sistema de archivos local o desde conexiones basadas en archivos a los orígenes de datos
Activos de datos de archivos cargados desde el sistema de archivos local o desde conexiones basadas en archivo a los orígenes de datos, con estos formatos:
CSV
XLS, XLSM, XLSX (solo se ha perfilado la primera hoja de un libro de trabajo).
TSV
Avro
Parquet
Sin embargo, los archivos de datos estructurados no se perfilan cuando los activos de datos no hacen explícitamente referencia a los mismos, como en estos casos:
Los archivos están dentro de un activo de carpeta conectado. Los archivos a los que se puede acceder desde un activo de carpeta conectado no se tratan como activos y no se perfilan.
Los archivos están dentro de un archivo de archivador. El activo de datos hace referencia al archivo de archivador sin que se perfilen los archivos comprimidos.
Creación de un perfil
Copy link to section
En proyectos, puede crear un perfil para un activo de datos pulsando Crear perfil. Puede actualizar un perfil existente cuando cambien los datos.
Resultados de perfilado
Copy link to section
Cuando crea o actualiza un perfil de activo, se analizan las columnas del activo de datos. De forma predeterminada, el perfil se crea basándose en las primeras 5.000 filas de datos. Si el activo de datos tiene más de 250 columnas, el perfil se crea basándose en las primeras 1.000 filas de datos.
El perfil de un activo de datos muestra información sobre cada columna del conjunto de datos:
Cuándo se ha creado el perfil o se ha actualizado por última vez.
Cuántas columnas y filas se han analizado.
Los tipos de datos para la distribución de columnas y tipos de datos.
Los formatos de datos para la distribución de columnas y formatos.
Porcentaje de datos coincidentes, no coincidentes o que faltan para cada columna.
La distribución de frecuencias para todos los valores identificados en una columna.
Estadísticas sobre los datos de cada columna:
El número de valores distinct indica cuántos valores diferentes existen en los datos muestreados para la columna.
El porcentaje de valores exclusivos indica el porcentaje de valores distintos que aparecen sólo una vez en la columna.
El mínimo, el máximo o la media, y a veces la desviación estándar en esa columna. En función del formato de datos de una columna, las estadísticas varían ligeramente. Por ejemplo, las estadísticas para una columna de tipo de datos entero tienen valores mínimo, máximo y medio y un valor de desviación estándar, mientras que las estadísticas para una columna de tipo de datos serie tienen valores de longitud mínima, longitud máxima y longitud media.
Acerca de las cookies de este sitioNuestros sitios web necesitan algunas cookies para funcionar correctamente (necesarias). Además, se pueden utilizar otras cookies con su consentimiento para analizar el uso del sitio, para mejorar la experiencia del usuario y para publicidad.Para obtener más información, consulte sus opciones de preferencias de cookies. Al visitar nuestro sitio web, acepta que procesemos la información tal y como se describe en ladeclaración de privacidad de IBM.Para facilitar la navegación, sus preferencias de cookies se compartirán entre los dominios web de IBM que se muestran aquí.