0 / 0
Volver a la versión inglesa de la documentación
Gestión de definiciones de calidad de datos
Última actualización: 13 dic 2024
Gestión de definiciones de calidad de datos

Puede crear y gestionar definiciones de calidad de datos para definir la lógica que es útil para analizar la calidad de datos en los activos de datos.

Si tiene los permisos necesarios, puede gestionar las definiciones de calidad de datos de estas maneras:

También puede completar estas tareas con las API en lugar de con la interfaz de usuario. Los enlaces a estas API se listan en la sección Más información .

Permisos necesarios

Para ver definiciones de calidad de datos, debe tener al menos el rol Visor en el proyecto.

Para crear, editar o suprimir definiciones de calidad de datos, debe tener el permiso de usuario Gestionar activos de calidad de datos y el rol Admin o el rol Editor en el proyecto.

Creación de una definición de calidad de datos

Para crear una definición de calidad de datos:

  1. Abra un proyecto, haga clic Nuevo activo > Definir cómo medir la calidad de los datos .

  2. Definir detalles:

    • Especifique un nombre para la definición de calidad de datos.
    • Opcional: Especifique una descripción.
    • Opcional: Seleccione una dimensión de calidad de datos para describir la métrica de calidad de datos primaria para la lógica de reglas en este activo. La dimensión seleccionada se puede utilizar como categoría de informe, para filtrar o para visualizar datos seleccionados.
  3. Defina la lógica de reglas. Puede utilizar el editor de formato libre para construir la lógica de reglas. Especifique una expresión en el campo Expresión de regla . Para obtener una lista de expresiones que puede utilizar, consulte Bloques de construcción para la lógica de reglas. Compruebe también el conjunto de expresiones de regla de ejemplo. Estos ejemplos muestran cómo puede combinar los bloques de creación para la lógica de reglas. Puede copiar las expresiones proporcionadas en sus propias definiciones de calidad de datos y utilizarlas según se proporcionen o ajustarlas según sea necesario.

    Se aplican consideraciones especiales cuando la expresión contiene series que están entre comillas dobles, por ejemplo: ucase(trim(var_first_name)) NOT contains "YOU'RE"

    Estos valores se tratan como literales de serie. Sin embargo, si desea que dichos valores se traten como variables, puede cambiar la configuración del proyecto allow_quoted_variables a true mediante la API de IBM Knowledge Catalog Sustituir la configuración del proyecto para reglas de calidad de datos.

    Como alternativa a escribir las expresiones en el editor de formato libre, puede utilizar elementos de bloque para construir la lógica de reglas:

    1. Seleccione un elemento del grupo Lógica, por ejemplo IF THEN. Puede expandir la lógica de regla con los operadores AND, OR y NOT.

    2. Seleccione Comprobaciones, elija el tipo de comprobación que desea utilizar y conéctelo al bloque IF .

    3. Seleccione tantas condiciones como necesite para la comprobación en los grupos Variables y literales, Operaciones, Fecha y hora, General, Matemáticao Serie y arrástrelas a la lógica Comprobaciones .

    4. Seleccione uno o varios tipos de comprobación en el grupo Comprobaciones y conéctelos al bloque THEN.

    5. Seleccione tantas condiciones como necesite para la comprobación en los grupos Variables y literales, Operaciones, Fecha y hora, General, Matemáticao Serie y arrástrelas a la lógica Comprobaciones .

    6. Las acciones adicionales pasan a estar disponibles cuando pulsa con el botón derecho del ratón en el lienzo o en un bloque individual. Por ejemplo, puede duplicar el bloque o añadir un comentario.

    Consejo:

    Añada siempre los comentarios en la sección de bloque. Puede que indicar o actualizar comentarios en el área de texto Expresión de regla no siempre funcione como esté previsto.

    Puede suprimir un elemento de bloque o toda la construcción arrastrándolo a la papelera.

    Revise la lógica de regla en el campo Expresión de regla .

    Cuando pulse Crear, se comprobará la sintaxis de la expresión. Si es válido, se crea la definición de calidad de datos. Ahora puede crear reglas de calidad de datos a partir de esta definición.

Publicación de una definición de calidad de datos

Puede hacer que cualquier definición de calidad de datos esté disponible para su reutilización en otros proyectos publicándola en un catálogo desde donde se puede añadir a cualquier número de proyectos. Antes de hacerlo, asegúrese de que la descripción de la definición de calidad de datos proporciona información significativa. Dicha información ayuda a otros usuarios a elegir la definición de calidad de datos adecuada para utilizarla en su proyecto.

Para publicar una definición de calidad de datos:

  1. Seleccione la definición de calidad de datos en la lista de activos y pulse Publicar en catálogo. De forma alternativa, puede seleccionar Publicar en catálogo en el menú de desbordamiento del activo.

  2. Seleccione el catálogo y rellene las propiedades del activo.

  3. Si ya existe un duplicado de activos en el catálogo, puede especificar la acción que se debe realizar en ese caso. Las opciones que tiene vienen determinadas por el valor predeterminado del catálogo. Para obtener más información sobre el manejo de activos duplicados, consulte Manejo de activos duplicados en catálogos.

  4. Pulse Publicar. Los activos se añaden al catálogo y son de su propiedad. Los términos y etiquetas de negocio asignados se publican con el activo. Las reglas de gobernabilidad asignadas no se publican. Tiene que volver a crear estas relaciones manualmente después de publicar la definición.

    La expresión de regla y la dimensión de calidad de datos seleccionada también se publican y están disponibles en la vista previa del activo en el catálogo.

Si una definición de calidad de datos tiene un término asignado, la sección Definiciones de calidad de datos de la página Contenido relacionado del término tiene una entrada para cada contenedor en el que reside la definición con esa relación. Lo mismo se aplica a las relaciones con reglas de gobierno.

Cuando se añade una definición de calidad de datos de un catálogo a un proyecto, las clasificaciones asignadas y las relaciones que puedan estar definidas no se copian en el proyecto.

Edición de una definición de calidad de datos

Puede editar una definición de calidad de datos para actualizar su nombre, su descripción, la dimensión de calidad de datos seleccionada, la expresión de regla o cualquier término de negocio o asignación de regla de gobernabilidad.

Para editar una definición de calidad de datos, abra el activo y, a continuación, realice la acción adecuada:

  • Haga clic en el icono Editar ' icono de edición ' situado junto a la propiedad que desea modificar.
  • Seleccione una opción en el menú de desbordamiento junto al nombre de activo. Por ejemplo, puede seleccionar Renombrar para cambiar el nombre del activo.

Recuerde que cualquier cambio en la expresión de regla afecta a todas las reglas derivadas de esta definición de calidad de datos. Para ver qué reglas están relacionadas con esta definición de calidad de datos, si las hay, haga clic en el icono de información ' Icono de información.

Supresión de una definición de calidad de datos

Puede suprimir una definición de calidad de datos de una de estas maneras:

  • En el proyecto, seleccione la definición de calidad de datos y pulse Suprimir.
  • Abra la definición de calidad de datos y seleccione Suprimir en el menú de desbordamiento situado junto al nombre de la definición de calidad de datos.

Si alguna regla de calidad de datos se basa en esta definición de calidad de datos, debe suprimir dichas reglas antes de poder suprimir la definición.

Más información

Tema padre: Gestión de calidad de datos

Búsqueda y respuesta de IA generativa
Estas respuestas las genera un modelo de lenguaje grande en watsonx.ai que se basa en el contenido de la documentación del producto. Más información