Translation not up to date
Po pomyślnym przeanalizowaniu zasobu danych wyniki są wyświetlane zarówno na poziomie zasobu danych, jak i na poziomie kolumny. Wyniki analizy obejmują informacje o zawartości i strukturze zasobu danych oraz metryki dotyczące ogólnej jakości danych.
Wyniki analizy jakości danych są dostępne na stronie Jakość danych zasobu aplikacyjnego w projekcie lub katalogu. Dostęp do nich można również uzyskać z poziomu wzbogacania metadanych, klikając ocenę jakości zasobu lub kolumny.
- Wymagana usługa
- Usługa Watson Knowledge Catalog
- Opcjonalnie: usługa
IBM Match 360 do dopasowywania - Wyniki jakości danych wynikające z zasad jakości danych są dostępne tylko w regionach Dallas i Frankfurcie. Patrz Ograniczenia regionalne dla produktu Cloud Pak for Data as a Service.
Informacje o jakości danych stają się dostępne w projekcie lub katalogu w następujący sposób:
W projekcie po pierwszym uruchomieniu sprawdzania jakości danych dla zasobu danych w jeden z następujących sposobów lub po dodaniu połączonego zasobu danych obiektu IBM Match 360 :
- Analiza jakości danych jest wykonywana na zasobie w ramach wzbogacania metadanych.
- Reguła jakości danych jest uruchamiana dla zasobu.
W katalogu:
- Zasób danych z informacjami o jakości danych jest publikowany w katalogu.
Oceny jakości są ponownie obliczane, a dane są odświeżane w następujący sposób:
W projekcie za każdym razem, gdy w zasobie aplikacyjnym jest uruchamiana kontrola jakości danych lub gdy aktualizowany jest zasób danych jednostki IBM Match 360 :
- Analiza jakości danych jest wykonywana w kontekście wzbogacania metadanych.
- Reguła jakości danych jest uruchamiana dla zasobu.
- Algorytm uzgadniania IBM Match 360 został zmieniony lub zostały naprawione potencjalne problemy z dopasowaniem.
W katalogu:
- Zasób aplikacyjny jest publikowany z projektu.
Można natychmiast zobaczyć, kiedy wyniki jakości zostały ostatnio zaktualizowane.
Informacje o jakości danych dla zasobu
Po uzyskaniu dostępu do informacji o jakości danych zasobu wyświetlane są ogólne wyniki jakości danych oraz wyniki kontroli jakości danych, które zostały uruchomione dla zasobu. Ponadto użytkownik ma dostęp do wyników analizy dla kolumn zasobu.
Ogólne wyniki na poziomie zasobu
Graficzna reprezentacja ocen jakości zapewnia ogólny obraz ogólnej jakości zasobu oraz poziomu jakości w odniesieniu do wymiarów zastosowanych do zasobu. W przypadku tych wyników informacje o trendach pokazują, w jaki sposób ogólna jakość lub ocena jakości dla wymiaru zmieniły się w czasie. Można wybrać, czy trend ma być wyświetlany w okresie 30, 90, czy 180 dni. Wymiar nie przedstawia informacji o trendzie, jeśli wcześniej nie było kontroli wnoszonej do tego wymiaru.
Ogólna ocena zasobu jest średnią ważoną wyników, które są udostępniane przez kolumny zasobu. Każdy wynik wymiaru jest średnią ważoną odpowiednich wyników wymiaru, które są udostępniane przez poszczególne kontrole.
Ogólne i wymiarowe oceny oraz informacje o trendzie są ponownie obliczane dla następujących zmian:
- Na zasobie wykonywana jest kontrola jakości danych.
- Ustawienie Przyczynia się do ogólnego wyniku dla kontroli lub kolumny zostało zmienione.
- Reguła jakości danych, która została zastosowana do zasobu, została usunięta.
- Profil zasobu aplikacyjnego zostanie usunięty na stronie Profil zasobu aplikacyjnego.
- Zasób aplikacyjny zostanie zaktualizowany w produkcie IBM Match 360.
Więcej informacji na ten temat zawiera sekcja Oceny jakości danych.
Wyniki kontroli jakości danych na poziomie zasobów
W tym miejscu można zobaczyć, które sprawdzenia zostały uruchomione dla zasobu i jakie były wyniki. Lista jest sortowana według daty, z najnowszymi sprawdzeniami u góry.
- Nazwa i logika
Nazwa reguły jakości danych i nazwa definicji jakości danych, która zawiera logikę reguły, lub nazwa predefiniowanego sprawdzenia jakości danych. Reguły jakości danych z powiązaniami zarządzanymi zewnętrznie i regułami opartymi na języku SQL nie są obecnie odzwierciedlane w tym miejscu.
Predefiniowane sprawdzenia jakości danych są uruchamiane dla całego zasobu. Jednak nie wszystkie z nich zwracają wyniki dla wszystkich kolumn. Na przykład sprawdzenie Wartości podejrzane identyfikuje wartości odstające w kolumnach liczbowych lub kolumnach łańcuchowych z danymi liczbowymi, ale nie zwraca wyników dla kolumn łańcuchowych z wartościami łańcuchowymi. Z tego powodu lista predefiniowanych sprawdzeń jakości danych może być krótsza dla poszczególnych kolumn.
W projekcie można kliknąć nazwę sprawdzenia jakości danych, aby uzyskać szczegółowe informacje. W przypadku predefiniowanych sprawdzeń jakości danych wyświetl informacje o ustaleniach: kolumny, w których występują problemy, oraz liczbę i procent wartości w tych kolumnach, które zostały zidentyfikowane jako problemy z jakością. W przypadku reguł jakości danych można wyświetlić ogólną konfigurację reguły i uzyskać dostęp do tabeli wynikowej reguły, jeśli jest ona skonfigurowana. Aby zaktualizować konfigurację reguły i mieć wymagane uprawnienia, można przejść bezpośrednio do zasobu, klikając opcję Wyświetl regułę jakości danych.
W przypadku połączonych zasobów danych jednostki IBM Match 360 w tym miejscu wyświetlana jest wartość Potencjalne dopasowania . Nie podano dalszych informacji dla tego typu kontroli.
- Typ
Typ sprawdzenia, którym może być Reguła jakości danych, Zgodnelub Profilowanie. Dopasowanie jest wyświetlane dla wyników IBM Match 360 . Profilowanie jest wyświetlane dla predefiniowanych sprawdzeń jakości danych, które zostały uruchomione w kontekście wzbogacania metadanych. Patrz sekcja Predefiniowane sprawdzenia jakości danych.
- Wymiar
Wymiar jakości danych, z którym powiązane jest to sprawdzenie. Predefiniowane sprawdzenia jakości danych, które są uruchamiane podczas profilowania lub w ramach wzbogacania metadanych, mają przypisane wymiary domyślne. W przypadku reguł jakości danych należy przypisać wymiary zgodnie z wymaganiami.
W przypadku połączonych zasobów danych jednostki IBM Match 360 wyświetlany jest wymiar ufność jednostki .
Jeśli żaden wymiar nie jest ustawiony, w polu widoczna jest wartość Brak. Więcej informacji na ten temat zawiera sekcja Wymiary danych jakości i sekcja Oceny jakości danych.
- Focus & percentage of data with issues (Aktywuj & procent danych z problemami)
W zależności od typu sprawdzania obiektem aktywnym może być jedna lub więcej kolumn lub cała tabela. W przypadku predefiniowanych sprawdzeń jakości danych obiektem aktywnym jest zawsze cała tabela. Procent danych z problemami pokazuje, jaka część danych nie spełnia kryteriów jakości zdefiniowanych w sprawdzeniu.
- Znaleziono sprawdzone & problemy z danymi
Liczba sprawdzanych rekordów oraz liczba znalezionych problemów z jakością. Te problemy mogą znajdować się w tym samym lub w różnych rekordach.
- Próbkowanie
Rodzaj próbki zastosowanej podczas ostatniego uruchomienia kontroli. W przypadku reguł jakości danych w tej kolumnie wyświetlany jest myślnik (-), jeśli nie skonfigurowano próbkowania. W przypadku dopasowania w kolumnie zawsze jest wyświetlany myślnik. W przypadku predefiniowanych sprawdzeń jakości danych kolumna zawsze ma wartość.
- Ocena
Ocena jakości zwrócona przez sprawdzenie dla zasobu.
- Przyczynia się do ogólnej oceny
To ustawienie określa, czy ten konkretny wynik jakości jest brany pod uwagę przy obliczaniu wyników ogólnych. To ustawienie można zmienić tylko w projekcie. Aby to zrobić, należy być administratorem lub edytorem projektu. W katalogu ustawienie jest zablokowane. Patrz sekcja Oceny jakości danych.
- Ostatnie sprawdzenie
Data i godzina ostatniego uruchomienia sprawdzenia.
Aby przejść do przeglądu kolumn, należy kliknąć opcję Kolumny.
W projekcie dostępna jest również opcja tworzenia nowych definicji jakości danych lub reguł jakości danych, jeśli komponent jakości danych produktu Watson Knowledge Catalog jest włączony. Użytkownik musi być administratorem lub edytorem projektu.
Przegląd kolumn
Wyświetl informacje o jakości danych dla poszczególnych kolumn:
- Nazwa kolumny.
- Ogólny wynik jakości danych kolumny.
- Ocena jakości kolumny dla dowolnego z wymiarów, które mają zastosowanie do zasobu. Myślnik (-) jest wyświetlany, jeśli żadna z kontroli, które zostały zastosowane do tej kolumny, nie została dodana do wymiaru.
- Liczba sprawdzeń wykonanych dla kolumny.
- Określa, czy ocena jakości danych kolumny jest uwzględniana przy obliczaniu ogólnej oceny zasobu i wyników wymiaru. Administrator lub edytujący projektu może zmienić to ustawienie.
- Data ostatniego sprawdzenia kolumny.
Następnie można zejść niżej w szczegółach jakości danych dla każdej kolumny. Patrz sekcja Informacje o jakości danych dla kolumny.
Można wrócić do listy kontroli jakości danych, klikając opcję Kontrole.
Informacje o jakości danych dla kolumny
Po uzyskaniu dostępu do informacji o jakości danych dla kolumny wyświetlana jest sekcja, która przedstawia ogólne wyniki jakości danych i użytkownik ma dostęp do wyników kontroli jakości danych, które zostały uruchomione dla kolumny. Dopasowanie nie ma wpływu na dane na poziomie kolumny.
Oprócz informacji o jakości można sprawdzić, która klasa danych i warunki biznesowe są przypisane do kolumny.
Ogólne wyniki na poziomie kolumny
Graficzna reprezentacja wyników jakości daje ogólny wgląd w ogólną jakość kolumny i poziom jakości w odniesieniu do wymiarów, które są stosowane do kolumny. W przypadku tych wyników informacje o trendach pokazują, w jaki sposób ogólna jakość lub ocena jakości dla wymiaru zmieniły się w czasie. Można wybrać, czy trend ma być wyświetlany w okresie 30, 90, czy 180 dni.
Ogólny wynik dla kolumny lub wymiaru jest średnią ważoną wyników uzyskanych w wyniku kontroli jakości danych, które zostały zastosowane do kolumny.
W projekcie ogólne i wymiarowe oceny oraz informacje o trendach są ponownie obliczane przy każdym uruchomieniu sprawdzenia jakości danych, które ma wpływ na kolumnę zasobu. Ocena jest również obliczana ponownie po zmianie ustawienia Przyczynia się do ogólnej oceny dla kontroli, która ma wpływ na kolumnę, lub po usunięciu reguł jakości danych lub profilu zasobu.
W katalogu wyniki ogólne i wymiarowe oraz informacje o trendach są aktualizowane, gdy zasób aplikacyjny jest publikowany z projektu.
Więcej informacji na ten temat zawiera sekcja Oceny jakości danych.
Wyniki kontroli jakości danych na poziomie kolumny
W tym miejscu można sprawdzić, które sprawdzenia zostały zastosowane do kolumny i jakie były wyniki. Lista jest sortowana według daty, z najnowszymi sprawdzeniami u góry.
- Nazwa i logika
Nazwa reguły jakości danych i nazwa definicji jakości danych, która zawiera logikę reguły, lub nazwa predefiniowanego sprawdzenia jakości danych. Reguły jakości danych z powiązaniami zarządzanymi zewnętrznie i regułami opartymi na języku SQL nie są obecnie odzwierciedlane w tym miejscu.
W projekcie można kliknąć nazwę reguły jakości danych, aby wyświetlić ogólną konfigurację reguły i tabelę wyjściową reguły (jeśli jest skonfigurowana). Aby zaktualizować konfigurację reguły i mieć wymagane uprawnienia, można przejść bezpośrednio do zasobu, klikając opcję Wyświetl regułę jakości danych.
- Typ
Typ sprawdzenia, którym może być Reguła jakości danych lub Profilowanie. Profilowanie jest wyświetlane dla predefiniowanych sprawdzeń jakości danych, które zostały uruchomione w kontekście wzbogacania metadanych. Patrz sekcja Predefiniowane sprawdzenia jakości danych.
- Wymiar
Wymiar jakości danych, z którym powiązane jest to sprawdzenie. Predefiniowane sprawdzenia jakości danych, które są uruchamiane podczas profilowania lub w ramach wzbogacania metadanych, mają przypisane wymiary domyślne. W przypadku reguł jakości danych można w razie potrzeby przypisać wymiary. Jeśli żaden wymiar nie jest ustawiony, w polu widoczna jest wartość Inne. Więcej informacji na ten temat zawiera sekcja Wymiary danych jakości i sekcja Oceny jakości danych.
- Procent danych z problemami
Ta wartość pokazuje, jaka część danych nie spełnia kryteriów jakości zdefiniowanych w sprawdzeniu.
- Znaleziono sprawdzone & problemy z danymi
Liczba sprawdzanych rekordów oraz liczba znalezionych problemów z jakością. Te problemy mogą znajdować się w tym samym lub w różnych rekordach.
- Próbkowanie
Rodzaj próbki zastosowanej podczas ostatniego uruchomienia kontroli. W przypadku reguł jakości danych w tej kolumnie wyświetlany jest myślnik (-), jeśli nie skonfigurowano próbkowania. W przypadku predefiniowanych sprawdzeń jakości danych kolumna zawsze ma wartość.
- Ocena
Ocena jakości zwrócona przez sprawdzenie dla kolumny.
- Przyczynia się do ogólnej oceny
To ustawienie określa, czy ten konkretny wynik jakości jest brany pod uwagę przy obliczaniu wyników ogólnych. To ustawienie można zmienić tylko w projekcie. Aby to zrobić, należy być administratorem lub edytorem projektu. W katalogu ustawienie jest zablokowane. Patrz sekcja Oceny jakości danych.
- Ostatnie sprawdzenie
Data i godzina ostatniego uruchomienia sprawdzenia.
Więcej inform.
Temat nadrzędny: Zarządzanie jakością danych