Cuando ejecuta perfiles avanzados en un activo de datos, se determina una distribución de frecuencia detallada para los distintos valores de cada columna del activo en función de los datos de origen.
Cuando configura los valores para una ejecución de perfilado avanzado, puede elegir escribir toda o parte de la información de distribución de frecuencia en una tabla de base de datos. Consulte Perfilado avanzado de datos. Puede acceder a esta tabla mediante consultas de base de datos estándar o la API de IBM Knowledge Catalog o a través del perfil de columna detallado. Sin embargo, el perfil de columna sólo mostrará los 100 primeros valores distintos, independientemente de cuántos valores se almacenen realmente.
Para cada valor distinto, la tabla contiene la información siguiente:
Nombre de columna | Descripción |
---|---|
AssetId | El ID del activo de datos en el proyecto. |
ChangeDate | La fecha en la que se actualizó la información. |
ColumnName | El nombre de la columna en el activo de datos. |
DataClassification | Una lista de los ID de las clases de datos asignadas a la columna en el activo de datos separados por comas (,). Si no se asigna ninguna clase de datos a la columna, la tabla muestra U . |
DistinctValue | El valor de datos real en la columna. La longitud máxima en bytes es de 4096 o 2.048 caracteres para Unicode. Todos los valores se almacenan como cadenas independientemente del tipo de datos real. Por lo tanto, el orden de clasificación de las cadenas se aplica cuando se ordenan los valores en el perfil de columna detallado. |
FrequencyCount | La frecuencia con la que se produce este valor. |
GeneralFormat | El formato que representa el patrón de caracteres de un valor de datos. Cada carácter alfabético se representa mediante una letra A en mayúsculas o minúsculas, en función de las mayúsculas y minúsculas del carácter. Cada carácter numérico se representa mediante el número 9. Los espacios y caracteres especiales se muestran a medida que aparecen. |
InferredDataType | El tipo de datos inferido, como entero, serie o fecha. |
ProjectId | El ID del proyecto en el que se ha ejecutado el análisis. |
PropertyLength | La longitud de un campo de serie. |
PropertyPrecision | Longitud total de un campo numérico. |
PropertyScale | La escala de un valor numérico es la longitud total del componente decimal de un campo numérico. |
Estas columnas adicionales están reservadas para uso interno y están sujetas a cambios sin previo aviso:
- Clase
- ChangedByUser
- DataClassificationStatusFlag
- DomainPattern
- DomainValueFlag
- DomainValueFlagDate
- DomainValueFlaggedByUser
- FieldNumber
- FormatFlag
- FormatFlagDate
- FormatFlaggedByUser
- InvalidReasonCode
- TipoODBC
- SourceOfDistinctValue
- TypeCode
- TypeOfDomainValue
Más información
- Creación avanzada de perfiles de datos
- Información de perfil a nivel de columna
- API de IBM Knowledge Catalog : Filtrar filas de la distribución de frecuencias
Tema padre: Revisión de los resultados de enriquecimiento de metadatos