0 / 0
Go back to the English version of the documentation
Nadzór nad danymi (Watson Knowledge Catalog)
Last updated: 03 lis 2023
Nadzór nad danymi (Watson Knowledge Catalog)

Nadzór nad danymi to proces śledzenia i kontrolowania zasobów danych na podstawie metadanych zasobów. Katalogi to obszary robocze, w których można zapewnić kontrolowany dostęp do zarządzanych zasobów.

Wymagana usługa
Watson Knowledge Catalog

Katalog zawiera zasoby aplikacyjne i współpracowników. Współpracownicy to osoby, które dodają zasoby aplikacyjne do katalogu i osoby, które muszą korzystać z zasobów aplikacyjnych. Istnieje możliwość dostosowania nadzoru nad danymi w celu wzbogacenia i kontrolowania zasobów danych w katalogach.

Dowiedz się więcej o nadzorowaniu lub rozpocznij pracę z katalogami i nadzorem:

Metody nadzoru nad danymi

Nadzór nad danymi można skonfigurować w sposób iteracyjny. Można rozpocząć od prostej implementacji nadzoru nad danymi, która opiera się na predefiniowanych artefaktach i funkcjach domyślnych. Następnie, w miarę zmiany potrzeb, można dostosować strukturę nadzoru nad danymi, aby lepiej opisywać i chronić zasoby danych.

Aby wyświetlić narzędzia, których można użyć do zarządzania danymi, należy otworzyć odwzorowanie narzędzi i usług i kliknąć opcję Zarządzanie w sekcji zadań.

Najprostsza implementacja nadzoru nad danymi

Katalog służy do współużytkowania zasobów w organizacji. Katalog może działać jako składnica składników, ponieważ zawiera zestawy danych z kolumnami, które są używane jako składniki (dane wejściowe) w modelach uczenia maszynowego. Administrator systemu Watson Knowledge Catalog musi utworzyć katalog do współużytkowania zasobów i dodać inżynierów danych, analityków danych i analityków biznesowych jako współpracowników. Współpracownicy katalogu mogą pracować z zasobami katalogowymi, kopiując je do projektów i publikując zasoby aplikacyjne, które tworzą w projektach, do katalogu.

Katalogi przechowują i śledzą zasoby. Projekty są miejscem, w którym użytkownicy przygotowują zasoby danych i budują modele. Zasoby aplikacyjne są przenoszone między katalogiem a projektami.

Współpracownicy katalogu mogą dodawać zasoby aplikacyjne do katalogu w celu ich współużytkowania z innymi osobami lub znajdować i używać zasobów aplikacyjnych w następujący sposób:

  • Inżynierowie danych dodają do katalogu oczyszczone dane, zwirtualizowane dane i zintegrowane dane.
  • Inżynierowie danych importują tabele lub pliki ze źródła danych do katalogu.
  • Analitycy danych i analitycy biznesowi znajdują zasoby danych w katalogach i dodają je do projektów, aby pracować z danymi.

Zasoby danych gromadzą metadane w czasie w następujący sposób:

  • Zasoby danych są profilowane, co powoduje automatyczne przypisanie predefiniowanych klas danych opisujących format danych.
  • Współpracownicy katalogu dodają do zasobów znaczniki, predefiniowane terminy biznesowe, klasy danych i klasyfikacje, relacje i oceny.
  • Wszystkie działania na zasobach są automatycznie zapisywane w historii zasobu.

Patrz sekcja Tworzenie katalogu.

Opcje dostosowywania nadzoru nad danymi

W dowolnym momencie można dodać lub zaktualizować dowolne opcje niestandardowe do implementacji nadzoru nad danymi. Zespół nadzoru może ustanowić słownik biznesowy, zaimportować i wzbogacić dane przy użyciu słownika, przeanalizować jakość danych, zdefiniować reguły ochrony danych, a następnie opublikować zasoby danych w katalogu, w którym mogą je znaleźć odbiorcy danych. Po zmianie danych można ponownie zaimportować metadane dotyczące tabel lub plików i wzbogacać zasoby danych o słownik biznesowy i analizę jakości danych. Istnieje możliwość tworzenia coraz bardziej precyzyjnych reguł w celu ochrony danych podczas rozszerzania słownika biznesowego. W całym cyklu nadzoru nad danymi analitycy danych i inni użytkownicy danych mogą znaleźć zaufane dane w katalogach. Na poniższej ilustracji przedstawiono, w jaki sposób nadzór nad danymi jest ciągłym cyklem odświeżania metadanych dla zasobów danych w celu odzwierciedlenia zmian w danych i zmianach w słowniku biznesowym.

Cykl zadań nadzoru nad danymi

Ustanawianie słownika biznesowego

  • Zespół nadzoru może ustanowić słownik biznesowy opisujący znaczenie danych z terminami biznesowymi oraz format danych z klasami danych. Słownik biznesowy ułatwia użytkownikom biznesowym znalezienie tego, czego szukają, przy użyciu terminów nietechnicznych.
  • Zespół może szybko utworzyć słownik biznesowy, importując istniejący słownik biznesowy lub importując Knowledge Accelerators , które udostępniają od kilkudziesięciu do tysięcy artefaktów nadzoru.
  • Administrator produktu Watson Knowledge Catalog może dostosować przepływ pracy, organizację, właściwości i relacje między artefaktami nadzoru.

Patrz sekcja Planowanie implementacji struktury zarządzania.

Importowanie i wzbogacanie zasobów danych przy użyciu słownika biznesowego

  • Zarządcy danych mogą regularnie uruchamiać zadania importowania i wzbogacania metadanych, które aktualizują katalog o zmiany w tabelach lub plikach ze źródeł danych i automatycznie przypisują odpowiednie terminy biznesowe i klasy danych.
  • Gdy zespół dodaje artefakty zarządzania, zadania wzbogacania metadanych sugerują nowe artefakty do nowych lub zaktualizowanych zasobów danych.
  • Gdy zarządcy danych potwierdzą lub dopasują przypisania terminów biznesowych podczas wzbogacania metadanych, algorytmy uczenia maszynowego do przypisywania terminów staną się bardziej dokładne w odniesieniu do danych.
  • Zarządcy danych mogą skonfigurować importowanie i wzbogacanie metadanych w taki sposób, aby były uruchamiane tylko po wykryciu zmian.

Więcej informacji na ten temat zawiera sekcja Planowanie obsługi zasobów danych do współużytkowania w katalogach.

Analiza jakości danych

  • Zarządcy danych mogą analizować jakość danych z ustawieniami domyślnymi podczas wzbogacania metadanych. Analiza jakości danych jest stosowana do każdego zasobu jako całości i do kolumn w tabelach.
  • Zarządcy danych mogą tworzyć niestandardowe definicje jakości danych i stosować je w regułach jakości danych lub stosować reguły jakości danych oparte na języku SQL.

Więcej informacji na ten temat zawiera sekcja Planowanie obsługi zasobów danych do współużytkowania w katalogach.

Ochrona danych za pomocą reguł

  • Zespół nadzoru może utworzyć plan reguł ochrony danych, pisząc strategie dokumentujące standardy i wytyczne organizacji dotyczące ochrony danych i zarządzania nimi. Na przykład strategia może opisywać konkretny przepis oraz sposób, w jaki reguła ochrony danych zapewnia zgodność z tym przepisem.
  • Zespół nadzoru może tworzyć reguły ochrony danych, które definiują sposób zachowania prywatności informacji prywatnych. Reguły ochrony danych są automatycznie wartościowane w celu wymuszenia za każdym razem, gdy użytkownik próbuje uzyskać dostęp do zasobu danych w dowolnym katalogu podlegającym regulacji na platformie. Reguły ochrony danych mogą definiować sposób kontrolowania dostępu do danych, maskowania wartości wrażliwych lub filtrowania wierszy z zasobów danych.
  • Zespół może rozpocząć pracę z regułami ochrony danych opartymi na niestandardowych znacznikach, użytkownikach lub predefiniowanych klasach danych, warunkach biznesowych i klasyfikacjach. Gdy zespół nadzoru doda artefakty nadzoru, może zdefiniować reguły ochrony danych na podstawie słownika biznesowego.
  • Inżynierowie danych mogą wymuszać stosowanie reguł ochrony danych w przypadku danych zwirtualizowanych.
  • Inżynierowie danych mogą trwale maskować dane w zasobach danych za pomocą przepływów maskujących.

Patrz Planowanie ochrony danych za pomocą reguł.

Pierwsze kroki z produktem Watson Knowledge Catalog

Zadania, które należy wykonać, aby rozpocząć pracę z produktem Watson Knowledge Catalog , zależą od celu użytkownika. Działania, które można wykonać, są definiowane przez role dostępu usługi Cloud Pak for Data . Niektóre działania mają również wymagania dotyczące roli obszaru roboczego, takie jak praca grupowa w katalogu lub kategorii.

Aby sprawdzić swoje role dostępu do usług, zapoznaj się z sekcją Określanie konta i ról dostępu do usług IBM Cloud. Informacje na temat ról w systemie Watson Knowledge Catalog zawiera sekcja Role i uprawnienia użytkowników.

W poniższej tabeli przedstawiono wspólne cele, wymagane role dostępu do usług Cloud Pak for Data oraz odsyłacze do informacji umożliwiające rozpoczęcie pracy.

Cel Wymagana rola dostępu do usługi Cloud Pak for Data Dodatkowe informacje
Konfigurowanie i administrowanie produktem Watson Knowledge Catalog Menedżer Planowanie wdrożenia nadzoru nad danymi
Konfigurowanie produktu Watson Knowledge Catalog
Zarządzanie produktem Watson Knowledge Catalog
Znajdowanie zasobów lub składników w katalogu Dowolna rola Znajdowanie zasobów aplikacyjnych w katalogu
Wyszukiwanie zasobów aplikacyjnych w obrębie platformy
Dodawanie zasobu aplikacyjnego katalogu do projektu
Dane kuratorki CloudPak Data Steward lub
CloudPak Data Engineer
Curating data
Planowanie obsługi danych
Zarządzanie jakością danych CloudPak Data Steward lub
CloudPak Data Engineer
Zarządzanie jakością danych
Tworzenie artefaktów zarządzania CloudPak Data Steward lub
CloudPak Data Engineer
Zarządzanie artefaktami zarządzania
Importowanie akceleratorów wiedzy Knowledge Accelerators
Planowanie implementacji struktury zarządzania
Tworzenie reguł ochrony danych CloudPak Data Steward lub
CloudPak Data Engineer
Reguły ochrony danych
Planowanie ochrony danych za pomocą reguł
Uruchom interfejsy API Watson Knowledge Catalog Ta sama rola dla wykonywania zadania w interfejsie użytkownika. Interfejsy APIWatson
Generowanie raportów dotyczących produktu Watson Knowledge Catalog Administrator raportowania Konfigurowanie raportowania

Więcej inform.

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more