Przypadek użycia nadzoru nad danymi | IBM Cloud Pak for Data as a Service

Translation not up to date

The translation of this page does not represent the latest version. For the latest updates, see the English version of the documentation.

Go back to the English version of the documentation

Przypadek użycia nadzoru nad danymi

Wiele przedsiębiorstw boryka się z trudnościami w zrównoważeniu korzyści płynących z zapewnienia dostępu do danych z koniecznością ochrony wrażliwych danych. Cloud Pak for Data as a Service udostępnia metody, które są potrzebne w przedsiębiorstwie do zautomatyzowania nadzoru nad danymi, aby zapewnić dostępność i ochronę danych.

Obejrzyj ten film wideo, aby zobaczyć przykład użycia struktury danych na potrzeby implementowania rozwiązania do nadzoru nad danymi w produkcie Cloud Pak for Data.

Ten film wideo zawiera wizualną metodę zapoznawania się z pojęciami i zadaniami opisanymi w tej dokumentacji.

Wyzwania

Wiele przedsiębiorstw stoi przed następującymi wyzwaniami związanymi z zarządzaniem danymi:

Ochrona prywatności danych na dużą skalę: Organizacje muszą przestrzegać przepisów dotyczących ochrony prywatności danych w źródłach danych na wielu platformach chmurowych i w środowisku lokalnym.
Dostęp do danych wysokiej jakości: Organizacje muszą zapewnić dostęp do wysokiej jakości danych korporacyjnych w wielu zespołach.
Tworzenie kompletnego profilu klienta: Zespoły muszą tworzyć dokładne widoki klientów na dużą skalę, szybko, w celu optymalizacji procesów samoobsługowych i zarządzania danymi.
Wykorzystanie samoobsługowych danych: Konsumenci danych, tacy jak analitycy danych, walczą o znalezienie i wykorzystanie potrzebnych im danych.

Problemy te można rozwiązać, implementując strukturę danych za pomocą usługi Cloud Pak for Data as a Service.

Przykład: wyzwania związane z Złotym Bankiem

Śledź historię Golden Bank, ponieważ zespół nadzoru wdraża nadzór nad danymi. Golden Bank dysponuje dużą ilością danych dotyczących klientów i kredytów hipotecznych, które obejmują dane wrażliwe. Bank chce zapewnić jakość danych, zamaskować dane wrażliwe i udostępnić je do użytku w kilku działach.

Proces

Sposób implementowania nadzoru nad danymi zależy od potrzeb organizacji. Nadzór nad danymi można zaimplementować w sposób liniowy lub iteracyjny. Można polegać na domyślnych funkcjach i predefiniowanych artefaktach lub dostosować rozwiązanie.

Aby zaimplementować nadzór nad danymi, organizacja może postępować zgodnie z następującym procesem:

Tworzenie słownika biznesowego
Definiowanie reguł w celu ochrony danych
Sprawdź swoje dane
Współużytkowanie danych lub praca z nimi

Usługi Watson Knowledge Catalog i Match 360 w produkcie Cloud Pak for Data as a Service udostępniają wszystkie narzędzia i procesy potrzebne organizacji do zaimplementowania rozwiązania do zarządzania danymi.

Obraz przedstawiający przepływ zasobów aplikacyjnych w przypadku użycia zarządzania danymi

1. Ustanowcie swoje słownictwo biznesowe

Aby sprostać wyzwaniom, zespół musi ustanowić słownik biznesowy, importując lub tworząc artefakty nadzoru, które pełnią rolę metadanych w celu sklasyfikowania i opisania danych:

Zanim będzie można zautomatyzować ochronę prywatności danych, zespół musi upewnić się, że dane, które mają być kontrolowane, są dokładnie zidentyfikowane.
Przed analizowaniem jakości danych należy zidentyfikować format danych.
Aby ułatwić wyszukiwanie danych, zespół musi upewnić się, że treść danych jest dokładnie opisana.

W tym pierwszym kroku procesu zespół zarządzania może oprzeć się na predefiniowanych artefaktach zarządzania i utworzyć niestandardowe artefakty zarządzania, które są specyficzne dla organizacji. Istnieje możliwość tworzenia artefaktów opisujących format, znaczenie biznesowe, czułość, zakres wartości i strategie zarządzania danymi.

Co można użyć	Co można zrobić	Najlepiej używać, gdy
Kategorie	Predefiniowana kategoria służy do przechowywania artefaktów zarządzania. Tworzenie kategorii w celu zorganizowania artefaktów zarządzania w strukturze hierarchicznej podobnej do folderów. Dodaj współpracowników z rolami, które definiują ich uprawnienia do artefaktów w kategorii.	Potrzeba więcej niż predefiniowana kategoria. Użytkownik chce precyzyjnie kontrolować, kto może być właścicielem, autorem i wyświetlać artefakty zarządzania.
Przepływy pracy	Użyj domyślnej konfiguracji przepływu pracy, która nie ogranicza możliwości tworzenia artefaktów zarządzania ani nie wymaga przeglądów. Skonfiguruj przepływy pracy dla artefaktów zarządzania i wskaż osoby, które mogą tworzyć typy artefaktów zarządzania w poszczególnych kategoriach.	Użytkownik chce kontrolować, kto tworzy artefakty zarządzania. Przed opublikowaniem wersji roboczych artefaktów zarządzania mają być one przeglądane.
Artefakty zarządzania	Należy użyć predefiniowanych terminów biznesowych, klas danych i klasyfikacji. Tworzenie artefaktów nadzoru, które pełnią rolę metadanych w celu wzbogacania, definiowania i kontrolowania zasobów danych.	Chcesz dodać wiedzę i znaczenie do zasobów, aby ułatwić zrozumienie danych. Chcesz poprawić analizę jakości danych.
Knowledge Accelerators	Zaimportuj zestaw predefiniowanych artefaktów nadzoru, aby poprawić klasyfikację danych, zgodność z przepisami, analizę samoobsługową i inne operacje nadzoru.	Do opisania problemów biznesowych, wydajności biznesowej, standardów branżowych i przepisów potrzebny jest standardowy słownik. Aby zaoszczędzić czas, należy zaimportować wstępnie utworzone artefakty zarządzania.

Przykład: słownik biznesowy Golden Bank

Lider zespołu zarządzania w banku Golden Bank rozpoczyna od utworzenia kategorii Bankowość, w której przechowywane będą artefakty zarządzania, które zespół planuje utworzyć. Lider zespołu dodaje pozostałych członków zespołu zarządzania jako współpracowników do kategorii Bankowość z rolą Edytujący , aby mieć uprawnienie do tworzenia artefaktów zarządzania. Następnie lider zespołu konfiguruje przepływy pracy w taki sposób, aby inny członek zespołu był odpowiedzialny za tworzenie artefaktów każdego typu. Wszystkie przepływy pracy wymagają zatwierdzenia przez lidera zespołu.

Jeden członek zespołu nadzoru importuje zestaw terminów biznesowych z arkusza kalkulacyjnego. Niektóre warunki biznesowe są powiązane z zawodami klientów osobistych. Inny członek zespołu tworzy zestaw danych odniesienia "Zawody", który zawiera listę zawodów, w przypadku których każdy zawód ma numer identyfikacyjny. Trzeci członek zespołu tworzy niestandardową klasę danych "Profesja" w celu identyfikacji zawodu klienta osobistego na podstawie referencyjnego zestawu danych.

2. Definiowanie reguł w celu ochrony danych

W następnym kroku procesu zespół definiuje reguły w celu zapewnienia zgodności z przepisami dotyczącymi ochrony prywatności danych, kontrolując, kto może zobaczyć, jakie dane są wyświetlane. Zespół tworzy reguły ochrony danych, aby zdefiniować sposób ochrony danych w katalogach zarządzanych. Zespół może korzystać z tych reguł ochrony danych w celu ukrywania poufnych danych na podstawie treści, formatu lub znaczenia danych lub tożsamości użytkowników, którzy uzyskują do nich dostęp.

Co można użyć	Co można zrobić	Najlepiej używać, gdy
Reguły ochrony danych	Chroń poufne informacje przed dostępem bez uprawnień w katalogach zarządzanych, odmawiając dostępu do danych, masując wartości danych lub filtrując wiersze w zasobach danych. Dynamiczne i spójne maskowanie danych w katalogach zarządzanych na poziomie szczegółowości zdefiniowanym przez użytkownika.	Należy automatycznie wymuszać prywatność danych we wszystkich katalogach podlegających regulacjom. Użytkownik chce zachować dostępność i użyteczność danych przy jednoczesnym zachowaniu zgodności z przepisami o ochronie prywatności.
Maskowanie przepływów	Podczas wyodrębniania kopii lub podzbiorów danych produkcyjnych należy korzystać z zaawansowanych funkcji maskowania danych zachowujących format.	Potrzebne są anonimizowane dane uczące i zestawy testów, które zachowują integralność danych.
Strategie i reguły zarządzania	Opisz i udokumentuj wytyczne, przepisy, standardy lub procedury dotyczące bezpieczeństwa danych w organizacji. Opisz wymagane zachowanie lub działania w celu zaimplementowania strategii nadzoru.	Osoby korzystające z danych mają rozumieć strategie nadzoru nad danymi.

Przykład: zasady ochrony danych w Golden Bank

Aby utworzyć model predykcyjny dla zatwierdzania kredytów hipotecznych, analitycy danych z Golden Bank potrzebują dostępu do zbiorów danych, które zawierają dane wrażliwe. Na przykład analitycy danych chcą uzyskać dostęp do tabeli zawierającej dane dotyczące osób ubiegających się o kredyt hipoteczny, która zawiera kolumnę z numerami ubezpieczenia społecznego.

Członek zespołu nadzoru tworzy regułę ochrony danych, która maskuje numery ubezpieczenia społecznego. Jeśli przypisana klasa danych kolumny w zasobie danych to "US Social Security Number", wartości w tej kolumnie są zastępowane przez 10 Xs.

Członek zespołu nadzoru tworzy strategię obejmującą regułę ochrony danych. Strategia opisuje przyczyny biznesowe implementacji reguły.

3. Kuracja danych do współużytkowania w katalogach

Zarządcy danych kierują wysokiej jakości zasobami danych w projektach i publikują je w katalogach, w których mogą je znaleźć osoby, które ich potrzebują. Zarządcy danych wzbogacają zasoby danych, przypisując artefakty nadzoru jako metadane, które opisują dane i informują o wyszukiwaniu semantycznym danych.

Co można użyć	Co można zrobić	Najlepiej używać, gdy
Metadata import	Automatyczne importowanie metadanych technicznych dla danych powiązanych z połączeniem w celu utworzenia zasobów danych.	Należy utworzyć wiele zasobów danych ze źródła danych. Należy odświeżyć zasoby danych, które zostały wcześniej zaimportowane.
Wzbogacanie metadanych	Profilowanie wielu zasobów danych w jednym uruchomieniu w celu automatycznego przypisania klas danych i zidentyfikowania typów danych i formatów kolumn. Automatyczne przypisywanie terminów biznesowych do zasobów i generowanie sugestii terminów na podstawie klasyfikacji danych. Uruchom ponownie zadania importowania i wzbogacania w regularnych odstępach czasu, aby wykryć i ocenić zmiany w zasobach danych.	Należy uzyskać i opublikować wiele zaimportowanych zasobów danych.
Analiza jakości danych	Analiza jakości dla wielu zestawów danych w jednym przebiegu umożliwia skanowanie w poszukiwaniu wspólnych wymiarów jakości danych, takich jak braki danych lub naruszenia klas danych. Kontynuacja śledzenia zmian w treści i strukturze danych oraz rekurencyjna analiza zmienionych danych.	Należy wiedzieć, czy jakość danych może mieć wpływ na dokładność analizy danych lub modeli. Użytkownicy muszą zidentyfikować zestawy danych do naprawy.
Eksplorator danych głównych	Za pomocą eksploratora danych głównych w produkcie IBM Match 360użytkownicy i systemy wyszukują, przeglądają i analizują jednostki danych głównych. Użytkownicy mogą wykrywać dane główne bezpośrednio w miejscu, w którym oczekują, że będą z nich korzystać.	Użytkownicy i systemy potrzebują całkowitego widoku danych. Użytkownicy i systemy muszą wyszukiwać, wyświetlać i analizować jednostki danych głównych. Do łączenia aplikacji biznesowych z zaufanymi danymi głównymi mają być używane interfejsy API.

Przykład: kuracja danych Golden Bank

Zarządcy danych w zespole nadzoru rozpoczynają importowanie metadanych w celu utworzenia zasobów danych w projekcie. Po zaimportowaniu metadanych Golden Bank ma dwa zasoby danych, które reprezentują tabele z kolumną o nazwie "ID". Po wzbogaceniu metadanych kolumny te są wyraźnie rozróżniane przez przypisane im metadane:

Do jednej kolumny są przypisane terminy biznesowe "Occupation" (Zawód) i "Profession" (Zawód) oraz klasa danych "Profession" (Zawód).
Do drugiej kolumny przypisywane są terminy biznesowe "Identyfikator osobisty" i "Prywatna osoba fizyczna" oraz klasa danych "Numer ubezpieczenia społecznego w Stanach Zjednoczonych".

Zarządcy danych przeprowadzają analizę jakości danych w odniesieniu do zasobów danych, aby upewnić się, że ogólna ocena jakości danych przekracza próg Golden Bank wynoszący 95%.

Inżynierowie ds. danych w Golden Bank łączą dane klientów z różnych systemów w całym przedsiębiorstwie, a także dane zewnętrzne, z danymi dotyczącymi oceny kredytowej w celu rozstrzygnięcia jednostek i utworzenia skonsolidowanego widoku klientów. Inżynierowie ustawiają i dodają zasoby do danych głównych, odwzorowują atrybuty zasobów danych, publikują model danych i uruchamiają algorytm uzgadniania w celu przygotowania danych do analizy.

Lider zespołu nadzoru tworzy katalog "Mortgage Approval Catalog" (Katalog zatwierdzania kredytów hipotecznych) i dodaje zarządców danych i analityków danych jako współpracowników katalogu. Zarządcy danych publikują w katalogu zasoby danych, które utworzyli w projekcie.

4. Współużytkowanie lub praca z danymi

Katalog pomaga zespołom w zrozumieniu danych i udostępnia odpowiednie dane do właściwego użytku. Analitycy danych i inne typy użytkowników mogą pomóc sobie w uzyskaniu potrzebnych im danych, zachowując jednocześnie zgodność z korporacyjnymi strategiami dostępu i ochrony danych. Mogą oni dodawać zasoby danych z katalogu do projektu, w którym współpracują w celu przygotowania, analizowania i modelowania danych.

Co można użyć	Co można zrobić	Najlepiej używać, gdy
Katalogi	Zorganizuj zasoby, aby udostępnić je współpracownikom w organizacji. Skorzystaj z wyszukiwania semantycznego opartego na sztucznej inteligencji i rekomendacji, aby pomóc użytkownikom w znalezieniu potrzebnych informacji.	Użytkownicy muszą łatwo zrozumieć, współpracować, wzbogacić i uzyskać dostęp do danych wysokiej jakości. Chcesz zwiększyć widoczność danych i współpracę między użytkownikami biznesowymi. Potrzebni są użytkownicy, którzy mogą wyświetlać, uzyskiwać dostęp do danych, manipulować nimi i je analizować bez zrozumienia ich fizycznego formatu lub lokalizacji oraz bez konieczności przenoszenia lub kopiowania. Użytkownicy powinni mieć możliwość rozszerzania zasobów aplikacyjnych przez ocenianie i przeglądanie zasobów.
Wyszukiwanie globalne	Wyszukiwanie zasobów aplikacyjnych we wszystkich projektach, katalogach i obszarach wdrażania, do których użytkownik ma dostęp. Wyszukiwanie artefaktów zarządzania we wszystkich kategoriach, do których użytkownik ma dostęp.	Należy znaleźć dane lub inny typ zasobu aplikacyjnego albo artefakt zarządzania.
Data Refinery	Należy wyczyścić dane, aby naprawić lub usunąć dane, które są niepoprawne, niekompletne, niepoprawnie sformatowane lub zduplikowane. Dane kształtu można dostosować, filtrując, sortując, łącząc lub usuwając kolumny.	Należy poprawić jakość lub przydatność danych.

Przykład: katalog Golden Bank

Analitycy danych znajdują potrzebne im zasoby danych w katalogu i kopiują je do projektu. W swoim projekcie analitycy danych mogą udoskonalić dane, aby przygotować je do trenowania modelu.

Kursy dotyczące nadzoru nad danymi

Samouczek	Opis	Wiedza specjalistyczna na potrzeby kursu
Curate wysokiej jakości dane	Twórz wysokiej jakości zasoby danych, wzbogacając dane i przeprowadzając analizę jakości danych.	Uruchom narzędzie Metadata import i narzędzia do wzbogacania metadanych.
Chroń dane	Kontrola dostępu do danych w produkcie Cloud Pak for Data as a Service.	Tworzenie reguł ochrony danych.
Wykorzystanie danych	Wyszukiwanie, kształtowanie i analizowanie danych.	Zapoznaj się z katalogiem i uruchom narzędzie Data Refinery .
Zarządzanie danymi wirtualnymi	Wzbogacanie zwirtualizowanych danych i zapewnienie ich ochrony.	Interfejs, projekty i katalogi produktu Watson Query umożliwiają zarządzanie zwirtualizowanymi danymi.
Konfigurowanie widoku 360 stopni	Konfigurowanie, odwzorowywanie i modelowanie danych w celu utworzenia skonsolidowanego widoku klientów.	Użyj interfejsu Match 360 przeciągnij i upuść, aby skonfigurować widok skonsolidowany.

Dowiedz się więcej o nadzorowaniu danych

Temat nadrzędny: Przegląd rozwiązania do obsługi sieci światłowodowej danych