0 / 0
Go back to the English version of the documentation
Wymiary jakości danych
Last updated: 20 wrz 2023
Wymiary jakości danych

Wymiary jakości danych opisują mierzalną cechę danych i ułatwiają definiowanie wymagań dotyczących jakości danych. Użyj wymiarów jakości danych, aby określić oczekiwane wyniki oceny jakości danych, bez względu na to, czy jest to wstępna ocena, czy też bieżące monitorowanie.

Stan, w którym dane mają być zwykle definiowane jako nadający się do użycia, defekt wolny, odpowiada specyfikacjilub Oczekiwania i wymagania dotyczące spotkania. Podczas mierzenia jakości danych porównywany jest bieżący stan daty do tego pożądanego stanu. Standardy, oczekiwania i wymagania, które są istotne dla Twoich procesów biznesowych, są wyrażone jako charakterystyka lub wymiary danych.

Data Management Association (DAMA) International opublikowała referat, który opisuje 6 podstawowych wymiarów jakości danych:

Dokładność
Wartości danych są jak najbardziej zbliżane do wartości rzeczywistych.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: brak
Kompletność
Wszystkie wymagane wartości danych są obecne.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy powiązane z tym wymiarem: Nieoczekiwane braki danych
Spójność
Wartości danych w kolumnie są zgodne z regułą.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: Niespójna wielkość liter, Niespójna reprezentacja braków danych, Podejrzane wartości
Terminowość
Dane przedstawiają rzeczywistość z wymaganego punktu w czasie.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: brak
Niepowtarzalność
Wartości odrębne pojawiają się tylko raz.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy powiązane z tym wymiarem: Nieoczekiwane zduplikowane wartości
Ważność
Dane są zgodne z formatem, typem lub zakresem jego definicji.
Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: Naruszenia klas danych, Naruszenia typów danych, Naruszenia formatu, Wartości spoza zakresu

Oprócz tych podstawowych wymiarów, które są wartościowane przez uruchomienie sprawdzania jakości danych, IBM Match 360 (jeśli wdrożono) wnosi wymiar ufności jednostki . Ten wymiar wskazuje, w jaki sposób system jest pewny, że obiekty zgodne z danymi są poprawne. Wynik wymiaru reprezentuje wartość procentową obiektów danego typu jednostki, które nie mają rekordów o potencjalnym dopasowaniu, jako element.

Więcej inform.

Temat nadrzędny: Zarządzanie jakością danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more