0 / 0
Volver a la versión inglesa de la documentación
Tablas de distribución de frecuencia
Última actualización: 13 dic 2024
Tablas de distribución de frecuencia

Cuando ejecuta perfiles avanzados en un activo de datos, se determina una distribución de frecuencia detallada para los distintos valores de cada columna del activo en función de los datos de origen.

Cuando configura los valores para una ejecución de perfilado avanzado, puede elegir escribir toda o parte de la información de distribución de frecuencia en una tabla de base de datos. Consulte Perfilado avanzado de datos. Puede acceder a esta tabla mediante consultas de base de datos estándar o la API de IBM Knowledge Catalog o a través del perfil de columna detallado. Sin embargo, el perfil de columna sólo mostrará los 100 primeros valores distintos, independientemente de cuántos valores se almacenen realmente.

Para cada valor distinto, la tabla contiene la información siguiente:

Tabla de distribución de frecuencia
Nombre de columna Descripción
AssetId El ID del activo de datos en el proyecto.
ChangeDate La fecha en la que se actualizó la información.
ColumnName El nombre de la columna en el activo de datos.
DataClassification Una lista de los ID de las clases de datos asignadas a la columna en el activo de datos separados por comas (,). Si no se asigna ninguna clase de datos a la columna, la tabla muestra U.
DistinctValue El valor de datos real en la columna. La longitud máxima en bytes es de 4096 o 2.048 caracteres para Unicode.
Todos los valores se almacenan como cadenas independientemente del tipo de datos real. Por lo tanto, el orden de clasificación de las cadenas se aplica cuando se ordenan los valores en el perfil de columna detallado.
FrequencyCount La frecuencia con la que se produce este valor.
GeneralFormat El formato que representa el patrón de caracteres de un valor de datos. Cada carácter alfabético se representa mediante una letra A en mayúsculas o minúsculas, en función de las mayúsculas y minúsculas del carácter.
Cada carácter numérico se representa mediante el número 9. Los espacios y caracteres especiales se muestran a medida que aparecen.
InferredDataType El tipo de datos inferido, como entero, serie o fecha.
ProjectId El ID del proyecto en el que se ha ejecutado el análisis.
PropertyLength La longitud de un campo de serie.
PropertyPrecision Longitud total de un campo numérico.
PropertyScale La escala de un valor numérico es la longitud total del componente decimal de un campo numérico.

Estas columnas adicionales están reservadas para uso interno y están sujetas a cambios sin previo aviso:

  • Clase
  • ChangedByUser
  • DataClassificationStatusFlag
  • DomainPattern
  • DomainValueFlag
  • DomainValueFlagDate
  • DomainValueFlaggedByUser
  • FieldNumber
  • FormatFlag
  • FormatFlagDate
  • FormatFlaggedByUser
  • InvalidReasonCode
  • TipoODBC
  • SourceOfDistinctValue
  • TypeCode
  • TypeOfDomainValue

Más información

Tema padre: Revisión de los resultados de enriquecimiento de metadatos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información