0 / 0
Zurück zur englischen Version der Dokumentation
Datenqualitätsdimensionen
Letzte Aktualisierung: 13. Dez. 2024
Datenqualitätsdimensionen

Datenqualitätsdimensionen beschreiben ein messbares Merkmal von Daten und helfen bei der Definition von Datenqualitätsanforderungen. Verwenden Sie Datenqualitätsdimensionen, um die erwarteten Ergebnisse der Datenqualitätsbewertung zu ermitteln, unabhängig davon, ob es sich um eine Erstbewertung oder eine fortlaufende Überwachung handelt.

Der Status, in dem sich Ihre Daten normalerweise befinden sollen, kann als für die Verwendung geeignet, fehlerfrei, entspricht der Spezifikationoder erfüllt Erwartungen und Anforderungendefiniert werden. Wenn Sie die Datenqualität messen, vergleichen Sie den tatsächlichen Status Ihrer Daten mit diesem gewünschten Status. Die Standards, Erwartungen und Anforderungen, die für Ihre Geschäftsprozesse wichtig sind, werden als Merkmale oder Dimensionen der Daten ausgedrückt.

Die Data Management Association (DAMA) International hat einen Bericht veröffentlicht, in dem 6 Kerndimensionen der Datenqualität beschrieben werden:

Dimensionen der Kerndatenqualität
Dimension Beschreibung Vordefinierte Datenqualitätsprüfungen, die Probleme identifizieren, die dieser Dimension zugeordnet sind
Genauigkeit Datenwerte sind so nah wie möglich an realen Werten. Keine.
Vollständigkeit Alle erforderlichen Datenwerte sind vorhanden. Unerwartete fehlende Werte
Konsistenz Datenwerte in einer Spalte entsprechen einer Regel. Inkonsistente Großschreibung
Inkonsistente Darstellung fehlender Werte
Verdächtige Werte
Pünktlichkeit Daten stellen die Realität ab einem erforderlichen Zeitpunkt dar. Keine.
Eindeutigkeit Unterschiedliche Werte werden nur einmal angezeigt. Unerwartete duplizierte Werte
Gültigkeit Die Daten entsprechen dem Format, Typ oder Bereich ihrer Definition. Verstöße gegen die Datenklassen
Verstöße gegen den Datentyp
Formatverstöße
Werte außerhalb des gültigen Bereichs

Sie können Ihre eigenen Datenqualitätsdimensionen erstellen, indem Sie die IBM Knowledge Catalog API Create a data quality dimension verwenden.

Weitere Informationen

Übergeordnetes Thema: Datenqualität verwalten

Generative KI-Suche und -Antwort
Diese Antworten werden von einem großen Sprachmodell in watsonx.ai basierend auf dem Inhalt der Produktdokumentation generiert. Weitere Informationen