0 / 0
Retourner à la version anglaise de la documentation
Gestion des définitions de qualité de données
Dernière mise à jour : 13 déc. 2024
Gestion des définitions de qualité de données

Vous pouvez créer et gérer des définitions de qualité de données pour définir une logique utile à l'analyse de la qualité de données dans vos actifs de données.

Si vous disposez des droits requis, vous pouvez gérer les définitions de qualité de données de la manière suivante:

Vous pouvez également effectuer ces tâches avec des API à la place de l'interface utilisateur. Les liens vers ces API sont répertoriés dans la section En savoir plus .

Droits requis

Pour afficher les définitions de qualité de données, vous devez disposer au moins du rôle Afficheur dans le projet.

Pour créer, éditer ou supprimer des définitions de qualité de données, vous devez disposer du droit d'utilisateur Gérer les actifs de qualité de données et du rôle Admin ou Editeur dans le projet.

Création d'une définition de qualité de données

Pour créer une définition de qualité de données:

  1. Ouvrez un projet, cliquez sur Nouvel actif > Définir comment mesurer la qualité des données .

  2. Définissez les détails :

    • Indiquez un nom pour la définition de qualité de données.
    • Facultatif : fournissez une description.
    • Facultatif: Sélectionnez une dimension de qualité de données pour décrire la métrique de qualité de données principale pour la logique de règle de cet actif. La dimension sélectionnée peut être utilisée comme catégorie de rapport, pour le filtrage ou pour la visualisation des données sélectionnées.
  3. Définissez la logique de la règle. Vous pouvez utiliser l'éditeur de format libre pour construire votre logique de règle. Entrez une expression dans la zone Expression de règle . Pour obtenir la liste des expressions que vous pouvez utiliser, voir Blocs de construction pour la logique de règle. Vérifiez également l'ensemble d' exemples d'expressions de règle. Ces exemples montrent comment combiner les blocs de construction pour la logique de règle. Vous pouvez copier les expressions fournies dans vos propres définitions de qualité de données et les utiliser comme indiqué ou les ajuster si nécessaire.

    Des considérations spéciales s'appliquent lorsque votre expression contient des chaînes placées entre guillemets, par exemple: ucase(trim(var_first_name)) NOT contains "YOU'RE"

    Ces valeurs sont traitées comme des littéraux chaîne. Toutefois, si vous souhaitez que ces valeurs soient traitées comme des variables, vous pouvez modifier le paramètre de projet allow_quoted_variables en true en utilisant l'API IBM Knowledge Catalog Remplacer les paramètres de projet pour les règles de qualité des données.

    Au lieu d'écrire vos expressions dans l'éditeur de format libre, vous pouvez utiliser des éléments de bloc pour construire votre logique de règle:

    1. Sélectionnez un élément dans le groupe Logic, par exemple IF THEN. Vous pouvez développer la logique de règle avec les opérateurs AND, OR et NOT.

    2. Sélectionnez Vérifications, choisissez le type de vérification que vous souhaitez utiliser et connectez-le au bloc IF .

    3. Sélectionnez autant de conditions que nécessaire pour la vérification dans les groupes Variables et littéraux, Opérations, Date et heure, Général, Mathématiqueou Chaîne , puis faites-les glisser dans la logique Checks .

    4. Sélectionnez un ou plusieurs types de vérification dans le groupe Vérifications et connectez-les au bloc THEN.

    5. Sélectionnez autant de conditions que nécessaire pour la vérification dans les groupes Variables et littéraux, Opérations, Date et heure, Général, Mathématiqueou Chaîne , puis faites-les glisser dans la logique Checks .

    6. Des actions supplémentaires sont disponibles lorsque vous cliquez avec le bouton droit de la souris sur le canevas ou sur un bloc individuel. Par exemple, vous pouvez dupliquer le bloc ou ajouter un commentaire.

    Astuce :

    Ajoutez toujours des commentaires dans la section des blocs. La saisie ou la mise à jour de commentaires dans la zone de texte Expression de règle peut ne pas toujours fonctionner comme prévu.

    Vous pouvez supprimer un élément de bloc ou la construction entière en le faisant glisser dans la corbeille.

    Vérifiez la logique de la règle dans la zone Expression de règle .

    Lorsque vous cliquez sur Créer, la syntaxe de l'expression est vérifiée. Si elle est valide, la définition de qualité de données est créée. Vous pouvez maintenant créer des règles de qualité de données à partir de cette définition.

Publication d'une définition de qualité de données

Vous pouvez rendre toute définition de qualité de données disponible pour être réutilisée dans d'autres projets en la publiant dans un catalogue à partir duquel elle peut être ajoutée à un nombre quelconque de projets. Avant de procéder, assurez-vous que la description de la définition de la qualité des données fournit des informations significatives. Ces informations aident les autres utilisateurs à choisir la bonne définition de qualité de données à utiliser dans leur projet.

Pour publier une définition de qualité de données:

  1. Sélectionnez la définition de qualité de données dans la liste des actifs et cliquez sur Publier dans le catalogue. Vous pouvez également sélectionner Publier dans le catalogue dans le menu déroulant dynamique de l'actif.

  2. Sélectionnez le catalogue et renseignez les propriétés de l'actif.

  3. Si un doublon d'actif existe déjà dans le catalogue, vous pouvez indiquer quelles actions doivent être prises dans ce cas. Les choix que vous avez sont déterminés par le paramètre par défaut du catalogue. Pour plus d'informations sur le traitement des actifs en double, voir Traitement des actifs en double dans les catalogues.

  4. Cliquez sur Publier. Les actifs sont ajoutés au catalogue et vous en êtes les propriétaire. Les termes métier et les balises affectés sont publiés avec l'actif. Les règles de gouvernance affectées ne sont pas publiées. Vous devez recréer ces relations manuellement après avoir publié la définition.

    L'expression de règle et la dimension de qualité de données sélectionnée sont également publiées et disponibles dans l'aperçu d'actif du catalogue.

Si un terme est affecté à une définition de qualité de données, la section Définitions de qualité de données de la page Contenu associé du terme comporte une entrée pour chaque conteneur dans lequel réside la définition avec cette relation. Il en va de même pour les relations avec les règles de gouvernance.

Lorsque vous ajoutez une définition de qualité des données d'un catalogue à un projet, les classifications attribuées et les relations éventuellement définies ne sont pas copiées dans le projet.

Edition d'une définition de qualité de données

Vous pouvez éditer une définition de qualité de données pour mettre à jour son nom, sa description, la dimension de qualité de données sélectionnée, l'expression de règle ou toute affectation de terme métier ou de règle de gouvernance.

Pour éditer une définition de qualité de données, ouvrez l'actif, puis effectuez l'action appropriée:

  • Cliquez sur l'icône " Icône d'édition à côté de la propriété que vous souhaitez modifier.
  • Sélectionnez une option dans le menu déroulant dynamique en regard du nom de l'actif. Par exemple, vous pouvez sélectionner Renommer pour modifier le nom de l'actif.

N'oubliez pas que toute modification apportée à l'expression de règle affecte toutes les règles dérivées de cette définition de qualité de données. Pour voir quelles règles sont liées à cette définition de la qualité des données, cliquez sur l'icône d'information " Icône d'information.

Suppression d'une définition de qualité de données

Vous pouvez supprimer une définition de qualité de données de l'une des manières suivantes:

  • Dans le projet, sélectionnez la définition de qualité de données et cliquez sur Supprimer.
  • Ouvrez la définition de qualité de données et sélectionnez Supprimer dans le menu déroulant dynamique en regard du nom de la définition de qualité de données.

Si des règles de qualité de données sont basées sur cette définition de qualité de données, vous devez supprimer ces règles avant de pouvoir supprimer la définition.

En savoir plus

Rubrique parent: Gestion de la qualité des données

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus