0 / 0
Retourner à la version anglaise de la documentation
Dimensions de la qualité des données
Dernière mise à jour : 13 déc. 2024
Dimensions de la qualité des données

Les dimensions de qualité des données décrivent une caractéristique mesurable des données et aident à définir les exigences de qualité des données. Utilisez les dimensions de la qualité des données pour déterminer les résultats attendus de l'évaluation de la qualité des données, qu'il s'agisse d'une évaluation initiale ou d'une surveillance continue.

L'état dans lequel vous souhaitez que vos données soient généralement peut être défini comme adapté à l'utilisation, sans incident, correspond à la spécificationou répondant aux attentes et aux exigences. Lorsque vous mesurez la qualité des données, vous comparez l'état réel de vos données à cet état souhaité. Les normes, les attentes et les exigences qui sont importantes pour vos processus métier sont exprimées en tant que caractéristiques ou dimensions des données.

L'association Data Management (DAMA) International a publié un article décrivant 6 dimensions de base de la qualité des données:

Dimensions de qualité des données de base
Dimension Descriptif Contrôles de qualité des données prédéfinis qui identifient les problèmes associés à cette dimension
exactitude Les valeurs de données sont aussi proches que possible des valeurs réelles. Néant.
Exhaustivité Toutes les valeurs de données requises sont présentes. Valeurs manquantes inattendues
Cohérence Les valeurs de données d'une colonne sont conformes à une règle. Capitalisation incohérente
Représentation incohérente des valeurs manquantes
Valeurs suspectes
Ponctualité Les données représentent la réalité à partir d'un point dans le temps requis. Néant.
Unicité Les valeurs distinctes n'apparaissent qu'une seule fois. Valeurs dupliquée inattendues
Validité Les données sont conformes au format, au type ou à la plage de sa définition. Violations de classe de données
Violations de type de données
Violations de format
Valeurs hors plage

Vous pouvez créer vos propres dimensions de qualité des données en utilisant l'API IBM Knowledge Catalog Create a data quality dimension.

En savoir plus

Rubrique parent: Gestion de la qualité des données

Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus