Paramètres du projet pour la qualité des données

Dernière mise à jour : 08 avr. 2025
Paramètres du projet pour la qualité des données

Pour une configuration cohérente des règles de qualité des données, vous pouvez configurer des paramètres par défaut qui peuvent être appliqués à n'importe quelle règle de qualité des données dans le projet.

Autorisations requises
Pour configurer les paramètres par défaut de la qualité des données, vous devez avoir le rôle d' administrateur dans le projet. Tout collaborateur de projet peut voir les paramètres.

Pour accéder aux paramètres par défaut, accédez à la page Gérer du projet et sélectionnez Outils > Qualité des données.

Tables de sortie

Pour une configuration cohérente des tables de sortie pour les règles de qualité des données, vous pouvez définir une configuration par défaut.

Type et emplacement de la sortie

Définir une nouvelle table de sortie ou sélectionner une table existante pour y écrire la sortie des règles. Pour les types de base de données pris en charge, voir Sources de données prises en charge pour la curation et la qualité des données.

Lorsque vous définissez une nouvelle table, le nom de la table peut être un nom défini par l'utilisateur, un paramètre pour la création dynamique d'un nom, une combinaison d'un nom défini par l'utilisateur et d'un paramètre, ou une combinaison de paramètres.

Les noms de tables définis par l'utilisateur doivent respecter cette convention :

  • Le premier caractère du nom doit être un caractère alphabétique.
  • Le reste du nom peut être composé de caractères alphabétiques, de caractères numériques ou de traits de soulignement.
  • Le nom ne doit pas contenir d'espaces.

Pour la création de noms dynamiques, vous pouvez utiliser ces paramètres :

  • #execution_id#
  • #rule_id#
  • #rule_id#
  • #rule_name#
  • #project_id#
  • #job_id#
  • #job_run_id#
  • #rule_id#

Pour les paramètres dont les valeurs changent, un nouveau tableau peut être créé :

  • Pour #job_run_id# , pour chaque règle, exécuter
  • Pour #execution_id# si la règle est exécutée à partir de l'interface utilisateur des règles de qualité des données ou via un appel API

En outre, vous pouvez sélectionner les options suivantes :

  • Créer une table uniquement lorsque des problèmes sont détectés

    Cette option permet d'éviter la création de tables vides dans les cas où une règle ne produit pas d'enregistrements en sortie. Toutefois, si une table portant ce nom existe déjà parce qu'elle a été générée lors de l'exécution d'une règle antérieure, elle reste inchangée.

  • Importer le tableau de sortie généré en tant qu'actif du projet

    Pour faciliter l'accès à la sortie des règles, ajoutez au projet de nouvelles tables de sortie des règles en tant que ressources de données. Au lieu d'exécuter une requête dans la base de données, vous pouvez afficher les données en ouvrant la ressource de données à partir de la page Ressources de votre projet ou de l' historique d'exécution de la règle.

    Cette option est activée par défaut.

Pour que cette configuration puisse être utilisée dans les règles de qualité des données, enregistrez-la. Le tableau configuré s'affiche alors comme Courant.

Vous pouvez mettre à jour cette configuration à tout moment. Ces mises à jour sont ensuite appliquées aux nouvelles règles et aux nouvelles exécutions de règles existantes qui sont configurées pour hériter des paramètres du projet.

En savoir plus

Thème parent : Gestion de la qualité des données