0 / 0
Volver a la versión inglesa de la documentación
Información de calidad de datos para activos de datos
Última actualización: 13 ago 2024
Información de calidad de datos para activos de datos

Los datos son útiles sólo si se confía en su calidad y se evalúa continuamente. Puede supervisar la calidad de datos de un activo de datos en su página Calidad de datos .

La misma información que en la pestaña Calidad de datos está disponible cuando pulsa una puntuación de calidad de datos en un activo de enriquecimiento de metadatos.

Requisitos y restricciones

Puede ver información de calidad de datos para activos en las circunstancias siguientes.

Servicios necesarios

La calidad de los datos requiere el servicio IBM Knowledge Catalog. Sin embargo, la salida de calidad de datos de las reglas de calidad de datos sólo está disponible en las regiones de Dallas y Frankfurt. Véase Limitaciones regionales para Cloud Pak for Data as a Service.

Permisos necesarios

Sus roles determinan cómo puede interactuar con la calidad de los datos:

  • Para ver la página Calidad de datos , puede tener cualquier rol de colaborador en el espacio de trabajo.
  • Para cambiar la forma en que se calculan las puntuaciones, debe tener el rol Admin o Editor en el proyecto.
  • Para crear nuevas comprobaciones de calidad de datos, debe tener el rol Admin o Editor en el proyecto y el permiso Gestionar activos de calidad de datos .
  • Para ver los datos que causaron problemas de calidad de datos (la tabla de salida) desde la página Calidad de datos, debe tener el permiso Desglosar los detalles del problema. Sin embargo, el activo de datos en el proyecto que se crea para la tabla de salida es accesible por cualquiera que pueda acceder a la conexión. Para limitar el acceso a este activo de datos, la conexión a la fuente de datos donde se almacena la tabla de salida debe configurarse con credenciales personales.

Espacios de trabajo

Puede ver información de calidad de datos en estos espacios de trabajo:

  • Proyectos
  • Catálogos

Tipos de activos

Estos tipos de activos tienen información de calidad de datos:

  • Activos de datos de bases de datos relacionales o no relacionales desde una conexión a los orígenes de datos
  • Activos de datos de conjuntos de datos particionados, donde un conjunto de datos particionados consta de varios archivos y está representado por una única carpeta cargada desde el sistema de archivos local o desde conexiones basadas en archivos a los orígenes de datos
  • Activos de datos de archivos cargados desde el sistema de archivos local o desde conexiones basadas en archivo a los orígenes de datos, con estos formatos:
    • CSV
    • XLS, XLSM, XLSX (Sólo la primera hoja de un libro de trabajo.)
    • TSV
    • Avro
    • OCR
    • Parquet
  • IBM Match 360 activos de datos de entidad

Visión general

En la página Calidad de datos , encontrará información sobre la calidad de un activo de datos:

Muestra información de calidad de datos para un activo de datos en un proyecto

  1. Puntuación de calidad de datos global del activo. Es el promedio ponderado de las puntuaciones proporcionadas por sus columnas. Para obtener más información, consulte Puntuaciones de calidad de datos.
  2. Las puntuaciones para las dimensiones individuales. Para cada dimensión, es la media ponderada de las puntuaciones de dimensión correspondientes proporcionadas por las comprobaciones individuales. Las comprobaciones de calidad de datos predefinidas que se ejecutan como parte del enriquecimiento de metadatos tienen dimensiones predeterminadas asignadas. Consulte Comprobaciones de calidad de datos predefinidas. Para las reglas de calidad de datos, asigne dimensiones según sea necesario. Para obtener más información, consulte Dimensiones de calidad de datos y Puntuaciones de calidad de datos.
  3. Información de tendencias que muestra cómo la calidad global o la puntuación de calidad de una dimensión ha cambiado durante 30, 90 o 180 días. Para obtener más información, consulte Resultados de análisis de calidad de datos.
  4. La lista de comprobaciones de calidad de datos que se han aplicado al activo y sus resultados. Para obtener más información, consulte Resultados de análisis de calidad de datos.
  5. Información de calidad de datos para las columnas individuales. Para obtener más información, consulte Resultados de análisis de calidad de datos.

La página Calidad de datos en proyectos

La página Calidad de datos se llena después de que se ejecute la primera comprobación de calidad de datos en el activo de datos de una de estas maneras:

  • El análisis de calidad de datos se ejecuta en el activo como parte del enriquecimiento de metadatos.
  • Una regla de calidad de datos se ejecuta en el activo.
  • Se añade un activo de datos de entidad IBM Match 360 conectado.

Cuando se importa un activo de un catálogo, sólo se copia la información de perfil en el proyecto. La información de calidad de datos no se copia.

Las puntuaciones de calidad se vuelven a calcular y los datos de esta página se renuevan en estos casos:

  • El análisis de calidad de datos se ejecuta en el contexto del enriquecimiento de metadatos.
  • Las reglas de calidad de datos se ejecutan en el activo.
  • Se suprime una regla de calidad de datos que ha contribuido a las puntuaciones. Se eliminan todos los problemas devueltos por esta regla de calidad de datos.
  • El perfil de activo se suprime en la página Perfil del activo. Se eliminan todos los problemas devueltos por las comprobaciones de calidad de datos predefinidas.

Las puntuaciones global y de dimensión también se actualizan cada vez que cambia el valor Contribuye a la puntuación global para una comprobación o una columna. Para obtener más información, consulte Puntuaciones de calidad de datos.

Puede ver inmediatamente cuándo se actualizaron por última vez las puntuaciones de calidad.

En la sección Comprobaciones de calidad de datos , puede ver la siguiente información:

  • Qué comprobaciones se han ejecutado en el activo, ordenadas por fecha con las comprobaciones más recientes en la parte superior
  • A qué dimensión está vinculada cada comprobación
  • Si se ha aplicado una comprobación a todo el activo o a las columnas del activo
  • Información sobre el número de problemas encontrados
  • Qué tipo de muestreo se ha aplicado, si procede
  • La puntuación de calidad de datos que ha generado una comprobación
  • Si la puntuación de calidad de datos de una comprobación se tiene en cuenta en el cálculo de la puntuación de activo global y las puntuaciones de dimensión
  • Cuándo se ejecutó por última vez la comprobación

Puede detallar más los resultados de cada comprobación excepto para la coincidencia IBM Match 360 . Como administrador o editor de proyectos, puede cambiar para cada comprobación si contribuye a la puntuación de calidad de datos global, y puede crear nuevas comprobaciones de calidad de datos. Para obtener más información, consulte Resultados de análisis de calidad de datos.

Puede conmutar entre la vista Comprobaciones y la vista Columnas . La sección Visión general de columnas muestra la información siguiente para cada columna que estaba sujeta a cualquiera de las comprobaciones de calidad de datos:

  • El nombre de columna
  • Puntuación de calidad de la columna para cualquiera de las dimensiones que son aplicables al activo
  • El número de comprobaciones que se han ejecutado en una columna
  • Si la puntuación de calidad de datos de la columna se tiene en cuenta en el cálculo de la puntuación de activo global y las puntuaciones de dimensión
  • Cuándo se comprobó por última vez la columna

A continuación, puede detallar más en los detalles de calidad de datos para cada columna. Como administrador o editor de proyectos, también puede cambiar para cada columna si su puntuación de calidad contribuye a la puntuación de calidad de datos global. Para obtener más información, consulte Resultados de análisis de calidad de datos.

La página Calidad de datos en catálogos

La página Calidad de datos se llena inicialmente cuando un activo de datos que tiene información de calidad de datos se publica en el catálogo. La página está vacía para cualquier activo que añada directamente como activo conectado o que cargue desde el sistema de archivos local. Para generar información de calidad de datos para dichos activos, añádalos a un proyecto y ejecute el enriquecimiento de metadatos o las reglas de calidad de datos en los activos. A continuación, publíquelos en el catálogo.

Las puntuaciones de calidad se actualizan y los datos de esta página se renuevan cada vez que se publica el activo desde un proyecto con nueva información de calidad de datos.

Puede ver inmediatamente cuándo se actualizaron por última vez las puntuaciones de calidad.

Las secciones Comprobaciones de calidad de datos y Visión general de columnas proporcionan la misma información que la pestaña Calidad de datos del proyecto. Sin embargo, no puede detallar más en los detalles de comprobación o de columna.

Más información

Tema padre: Tipos de activos y propiedades

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información