Vous pouvez créer et gérer des règles de qualité de données pour évaluer la qualité des données de votre projet.
Si vous disposez des droits requis, vous pouvez gérer les règles de qualité de données de la manière suivante:
- Créer des règles de qualité des données
- Editer une règle de qualité de données
- Supprimer les règles de qualité de données dont vous n'avez plus besoin
Vous pouvez également effectuer ces tâches avec des API à la place de l'interface utilisateur. Les liens vers ces API sont répertoriés dans la section En savoir plus .
- Services requis
- IBM Knowledge Catalog
- DataStage ou DataStage as a Service Anywhere '
Avec DataStage, vous pouvez exécuter des règles de qualité des données dans les régions prises en charge. Avec DataStage as a Service Anywhere, vous pouvez exécuter des règles de qualité des données en dehors d'IBM Cloud en utilisant des moteurs distants. Pour plus d'informations sur la configuration des moteurs distants, consultez la documentationDataStage as a Service Anywhere.
Droits requis
Pour afficher les règles de qualité des données, vous devez disposer au moins du rôle Afficheur dans le projet.
Pour créer, éditer ou supprimer des règles de qualité de données, vous devez disposer des droits utilisateur Gérer les actifs de qualité de données et du rôle Admin ou Editeur dans le projet.
Paramètres de projet pour l'exécution de règles
Les paramètres de niveau projet déterminent certains aspects de l'exécution des règles de qualité de données, par exemple, si les espaces de fin des valeurs de chaîne sont ignorés dans les vérifications d'égalité. Ces paramètres s'appliquent à toutes les règles de qualité de données d'un projet donné. Vous pouvez vérifier ou mettre à jour ces paramètres pour chaque projet en utilisant les API Get project settings for data quality rules et Replace project settings for data quality rules de l' IBM Knowledge Catalog.
Créer des règles de qualité des données
Vous pouvez créer différents types de règles de qualité de données:
Edition des règles de qualité de données
Vous pouvez éditer une règle de qualité de données pour mettre à jour sa description, la dimension de qualité de données sélectionnée, les affectations de terme métier ou la configuration de règle. Vous pouvez également gérer la liste des éléments associés.
Pour éditer une règle de qualité de données, ouvrez l'actif et effectuez les actions appropriées:
Pour mettre à jour la description ou les dimensions de la qualité des données, cliquez sur l'icône " " à côté du bien.
Pour gérer les termes métier, accédez à la section Artefacts de gouvernance de l'actif et ajoutez ou supprimez des termes si nécessaire.
Pour affecter ou supprimer des règles de gouvernance, accédez à la section Artefacts de gouvernance de l'actif et ajoutez ou supprimez des règles de gouvernance si nécessaire.
Pour mettre à jour la configuration de la règle, cliquez sur Editer la règle. Lorsque vous éditez la configuration de la règle, vous pouvez également modifier la façon dont la règle est générée: de l'utilisation de définitions de qualité de données à l'utilisation d'instructions SQL et inversement. Toutefois, lorsque vous effectuez cette opération, toutes les configurations de règles existantes sont supprimées et vous devez essentiellement commencer à partir de zéro.
Vous pouvez également modifier le type de sortie. En fonction de votre nouvelle sélection, tous les paramètres de sortie configurés sont réinitialisés ou écrasés. La sortie de règle écrite avant la modification reste inchangée.
Pour les règles de qualité de données qui lient directement les données, une relation Valide la qualité de données de avec chaque colonne liée et avec l'actif qui contient la colonne est ajoutée à la section Articles liés . Vous pouvez ajouter manuellement des actifs et des colonnes avec ce type de relation à tous les types de règles de qualité de données. Lorsque vous ajoutez des actifs et des colonnes à des règles de qualité de données avec des liaisons gérées en externe ou des règles de qualité de données SQL avec cette relation, ces types de règles contribuent aux scores de qualité de données de l'actif ou de la colonne correspondante. Le score et les problèmes générés par la règle sont signalés pour tous les actifs et les colonnes liés au type de relation Valide la qualité des données du type .
Lorsque vous consultez une règle de qualité des données, vous pouvez cliquer sur l'icône d'information " pour obtenir plus de détails, tels que les paramètres de sortie ou les ressources associées.
Suppression de règles de qualité de données
Vous pouvez supprimer une règle de qualité de données de l'une des manières suivantes:
- Dans le projet, sélectionnez la règle de qualité de données et cliquez sur Supprimer.
- Ouvrez la règle de qualité de données et sélectionnez Supprimer dans le menu déroulant dynamique en regard du nom de la règle de qualité de données.
Lorsque vous supprimez une règle de qualité de données, son historique d'exécution, tout flux DataStage et les travaux associés sont également supprimés du projet. Les tables de sortie du projet et de la base de données sont conservées. Les problèmes renvoyés par cette règle de qualité de données sont supprimés et les scores de qualité de données et de dimension sont recalculés.
En savoir plus
Etapes suivantes
Rubrique parent: Gestion de la qualité des données