Translation not up to date
Wymiary jakości danych opisują mierzalną cechę danych i ułatwiają definiowanie wymagań dotyczących jakości danych. Użyj wymiarów jakości danych, aby określić oczekiwane wyniki oceny jakości danych, bez względu na to, czy jest to wstępna ocena, czy też bieżące monitorowanie.
Stan, w którym dane mają być zwykle definiowane jako nadający się do użycia, defekt wolny, odpowiada specyfikacjilub Oczekiwania i wymagania dotyczące spotkania. Podczas mierzenia jakości danych porównywany jest bieżący stan daty do tego pożądanego stanu. Standardy, oczekiwania i wymagania, które są istotne dla Twoich procesów biznesowych, są wyrażone jako charakterystyka lub wymiary danych.
Data Management Association (DAMA) International opublikowała referat, który opisuje 6 podstawowych wymiarów jakości danych:
- Dokładność
- Wartości danych są jak najbardziej zbliżane do wartości rzeczywistych.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: brak
- Kompletność
- Wszystkie wymagane wartości danych są obecne.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy powiązane z tym wymiarem: Nieoczekiwane braki danych
- Spójność
- Wartości danych w kolumnie są zgodne z regułą.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: Niespójna wielkość liter, Niespójna reprezentacja braków danych, Podejrzane wartości
- Terminowość
- Dane przedstawiają rzeczywistość z wymaganego punktu w czasie.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: brak
- Niepowtarzalność
- Wartości odrębne pojawiają się tylko raz.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy powiązane z tym wymiarem: Nieoczekiwane zduplikowane wartości
- Ważność
- Dane są zgodne z formatem, typem lub zakresem jego definicji.
- Predefiniowane sprawdzenia jakości danych identyfikujące problemy związane z tym wymiarem: Naruszenia klas danych, Naruszenia typów danych, Naruszenia formatu, Wartości spoza zakresu
Oprócz tych podstawowych wymiarów, które są wartościowane przez uruchomienie sprawdzania jakości danych, IBM Match 360 (jeśli wdrożono) wnosi wymiar ufności jednostki . Ten wymiar wskazuje, w jaki sposób system jest pewny, że obiekty zgodne z danymi są poprawne. Wynik wymiaru reprezentuje wartość procentową obiektów danego typu jednostki, które nie mają rekordów o potencjalnym dopasowaniu, jako element.
Więcej inform.
- Wyniki analizy jakości danych
- Predefiniowane sprawdzenia jakości danych
- Konfigurowanie przepływów pracy danych głównych
- Interfejs API danych produktu Watson : lista wszystkich wymiarów jakości danych
Temat nadrzędny: Zarządzanie jakością danych