0 / 0
Wróć do wersji angielskiej dokumentacji
Przypadek użycia Data governance and privacy
Przypadek użycia Data governance and privacy

Przypadek użycia Data governance and privacy

Wiele przedsiębiorstw zmaga się z bilansem korzyści płynących z zapewnienia dostępu do danych z potrzebą ochrony wrażliwych danych. Cloud Pak for Data as a Service udostępnia metody, które przedsiębiorstwo potrzebuje do automatyzacji zarządzania danymi i prywatności, dzięki czemu można zapewnić dostępność i ochronę danych.

Obejrzyj ten film wideo, aby wyświetlić przypadek użycia sieci Fabric do zaimplementowania rozwiązania Data governance and privacy (Zarządzanie danymi i prywatności) w produkcie Cloud Pak for Data.

Ten film wideo udostępnia metodę wizualną jako alternatywę dla poniższych kroków opisowych w tej dokumentacji.

Wyzwania

Wiele przedsiębiorstw borykało się z następującymi wyzwaniami dotyczącymi zarządzania danymi i prywatności:

Zapewnianie prywatności danych w skali
Organizacje muszą przestrzegać przepisów o ochronie danych w źródłach danych na wielu platformach chmurowych i w siedzibie.

Dostęp do danych o wysokiej jakości danych
Organizacje muszą zapewniać dostęp do wysokiej jakości danych przedsiębiorstwa w wielu zespołach.

Zapewnianie samoobsługowej konsumpcji danych
Konsumenci danych, tacy jak naukowcy danych, zmagają się ze znależniem i używaniem potrzebnych danych.

Problemy te można rozwiązać, implementując sieć Fabric z danymi Cloud Pak for Data as a Service.

Przykład: wyzwania Golden Bank

Podążaj za historią Złotego Banku, ponieważ zespół rządzenia wdraża zarządzanie danymi. Golden Bank ma dużą ilość danych klientów i kredytów hipotecznych, które obejmują wrażliwe dane. Bank chce zapewnić jakość danych, maskować wrażliwe dane i udostępnić go do użytku w kilku działach.

Proces

Aby zaimplementować zarządzanie danymi i prywatność, organizacja może podążać za tym procesem:

  1. Konfigurowanie środowiska zarządzania
  2. Tworzenie reguł chroniących dane
  3. Kuruj dane do współużytkowania w katalogach
  4. Znajdź i użyj danych

Usługa Watson Knowledge Catalog w produkcie Cloud Pak for Data as a Service udostępnia wszystkie narzędzia i procesy, które muszą być zaimplementowane przez organizację użytkownika w celu zaimplementowania rozwiązania do zarządzania danymi i ochrony prywatności.

Obraz przedstawiający przepływ zasobów w przypadku zarządzania danymi i prywatności.

1. Konfigurowanie ram zarządzania

Aby spełnić wszystkie trzy wyzwania, zespół musi skonfigurować środowisko artefaktów zarządzania, które działają jako metadane do klasyfikowania i opisywania danych:

  • Zanim będzie można zautomatyzować prywatność danych, zespół musi upewnić się, że dane do sterowania są dokładnie identyfikowane.
  • Zanim będzie można przeanalizować jakość danych, należy zidentyfikować format danych.
  • Aby ułatwić znalezienie danych, Twój zespół musi się upewnić, że treść tych danych jest dokładnie opisana.

W pierwszym kroku procesu zespół zarządzania może tworzyć na podstawie predefiniowanych artefaktów zarządzania i tworzyć niestandardowe artefakty zarządzania, które są specyficzne dla danej organizacji. Istnieje możliwość tworzenia artefaktów w celu opisania formatu, znaczenia biznesowego, wrażliwości, zakresu wartości i strategii zarządzania danymi.

Co można użyć Co można zrobić Najlepiej używać, gdy
Kategorie Użyj predefiniowanej kategorii do przechowywania artefaktów zarządzania.

Utwórz kategorie, aby organizować artefakty zarządzania w strukturze hierarchicznej podobnej do folderów.

Dodaj współpracowników z rolami, które definiują ich uprawnienia do artefaktów w kategorii.
Potrzebna jest więcej niż predefiniowana kategoria.

Użytkownik ma mieć możliwość precyzyjnego kontrolowania tego, kto może być właścicielem, autorem i widokiem artefaktów zarządzania.
Przepływy pracy Użyj domyślnej konfiguracji przepływu pracy, która nie ogranicza tego, kto tworzy artefakty zarządzania lub wymaga przeglądów.

Skonfiguruj przepływy pracy dla artefaktów zarządzania i wyznaczono, kto może tworzyć typy artefaktów zarządzania, w których kategorie są tworzone.
Użytkownik chce sterować tym, kto tworzy artefakty zarządzania.

Użytkownik chce, aby robocze artefakty zarządzania zostały przejrzane przed ich opublikowaniem.
Artefakty zarządzania Użyj predefiniowanych klas danych i klasyfikacji.

Utwórz artefakty zarządzania, które działają jako metadane, aby wzbogacić, zdefiniować i kontrolować zasoby danych.
Użytkownik chce dodać wiedzę i znaczenie dla zasobów, aby pomóc ludziom w zrozumieniu danych.

Chcesz poprawić analizę jakości danych.
Knowledge Accelerators Zaimportuj zestaw predefiniowanych artefaktów zarządzania w celu poprawy klasyfikacji danych, zgodności z przepisami, analizy samoobsługowej i innych operacji zarządzania. Do opisywania problemów biznesowych, wydajności biznesowej, standardów branżowych i przepisów wymagany jest standardowy słownik.

Użytkownik chce zaoszczędzić czas, importując wstępnie utworzone artefakty zarządzania.


Przykład: ramy zarządzania Złotym Bankiem

Kierownik zespołu ds. zarządzania w Golden Bank rozpoczyna tworzenie kategorii Bankowość, która umożliwia wstrzymanie artefaktów zarządzania, które zespół planuje utworzyć. Kierownik zespołu dodaje do kategorii Bankowość pozostałe elementy zespołu zarządzania jako współpracowników z rolą Edytujący , dzięki czemu mają uprawnienia do tworzenia artefaktów zarządzania. Następnie kierownik zespołu konfiguruje przepływy pracy w taki sposób, aby inny członek zespołu był odpowiedzialny za tworzenie każdego typu artefaktu. Wszystkie przepływy pracy wymagają kroku zatwierdzenia przez kierownika zespołu.

Jeden członek zespołu zarządzania importuje zestaw terminów biznesowych z arkusza kalkulacyjnego. Niektóre z warunków biznesowych rozróżniają klientów indywidualnych i komercyjnych. Inny członek zespołu tworzy zestaw danych odniesienia, "Nazwy klientów na poziomie Diamond", który zawiera listę najlepszych klientów komercyjnych. Trzeci członek zespołu tworzy niestandardową klasę danych, "klienty na poziomie Diamond", aby zidentyfikować najlepszych klientów komercyjnych w oparciu o zestaw danych odniesienia.

2. Tworzenie reguł w celu ochrony danych

W następnym etapie procesu zespół konfiguruje reguły w celu zapewnienia zgodności z przepisami dotyczącymi prywatności danych przez kontrolowanie osób, które mogą wyświetlać dane. Zespół tworzy reguły ochrony danych, które chronią dane na całej platformie. Zespół może używać tych reguł ochrony danych do maskowania poufnych danych w oparciu o treść, format lub znaczenie danych lub tożsamość użytkowników, którzy uzyskują dostęp do tych danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Zasady ochrony danych Chroń poufne informacje przed nieautoryzowanym dostępem, odmawiając dostępu lub maskowania wartości danych w zasobach danych.

Dynamicznie i spójnie maskuj dane na poziomie szczegółowości zdefiniowanym przez użytkownika.
Użytkownik musi automatycznie egzekwować prywatność danych na platformie.

Użytkownik chce zachować dostępność i użyteczność danych w czasie, gdy jest on również zgodny z przepisami dotyczącymi prywatności.
Przepływy maskowania Użyj zaawansowanego formatu-zachowując możliwości maskowania danych podczas wyodrębniania kopii lub podzestawów danych produkcyjnych. Potrzebne są anonimizowane dane treningowe i zestawy testów, które zachowują integralność danych.
Zasady i zasady zarządzania Opisz i udokumentuj wytyczne, przepisy, standardy lub procedury organizacji w celu zapewnienia bezpieczeństwa danych.

Opisz wymagane zachowanie lub działania w celu zaimplementowania strategii zarządzania.
Użytkownik chce, aby osoby, które korzystają z danych, rozumieły strategie zarządzania danymi.


Przykład: zasady ochrony danych Golden Bank

Aby stworzyć model predykcyjny dla zatwierdzeń kredytów hipotecznych, naukowcy z danymi Golden Bank potrzebują dostępu do zestawów danych, które zawierają dane wrażliwe. Na przykład, naukowcy danych chcą uzyskać dostęp do tabeli z danymi dotyczącymi osób ubiegających się o kredyt hipoteczny, które obejmują kolumnę z numerami ubezpieczenia społecznego.

Członek zespołu ds. zarządzania tworzy regułę ochrony danych, która maskuje numery ubezpieczenia społecznego. Jeśli przypisaną klasą danych kolumny w zasobie danych jest "US Social Security Number", to wartości w tej kolumnie są zastępowane przez 10 Xs.

Członek zespołu zarządzania tworzy strategię, która zawiera regułę ochrony danych. Strategia opisuje przyczyny biznesowe dla implementowania reguły. Później, gdy użytkownicy, tacy jak naukowcy danych, widzą ikonę maskowania w kolumnie danych, mogą wyświetlać regułę ochrony danych, a następnie przeglądać powiązaną strategię, aby zrozumieć, dlaczego dane są maskowane.

3. Kurowanie danych do współużytkowania w katalogach

Zarządcy danych kurują wysokiej jakości zasoby danych w projektach i publikują je w katalogach, w których mogą je znaleźć osoby, które potrzebują tych danych. Zarządcy danych wzbogacają zasoby danych, przypisując artefakty zarządzania jako metadane opisujące dane i informując je o wyszukiwaniu semantycznym danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Metadata import Automatycznie importuj metadane techniczne dla danych, które są powiązane z połączeniem w celu utworzenia zasobów danych. Konieczne jest utworzenie wielu zasobów danych ze źródła danych.

Należy odświeżyć zasoby danych, które zostały wcześniej zaimportowane.
Wzbogacanie metadanych Profilowanie wielu zasobów danych w pojedynczym wykonaniu w celu automatycznego przypisywania klas danych oraz identyfikowania typów danych i formatów kolumn.

Automatycznie przypisuj warunki biznesowe do zasobów i wygeneruj sugestie dotyczące terminów w oparciu o klasyfikację danych.

Uruchom ponownie zadania importowania i wzbogacania w określonych odstępach czasu, aby wykryć i ocenić zmiany w zasobach danych.
Konieczne jest ograniczenie i opublikowanie wielu zaimportowanych zasobów danych.
Analiza jakości danych Przeprowadzanie analizy jakości w wielu zestawach danych w pojedynczym wykonaniu w celu skanowania wspólnych wymiarów jakości danych, takich jak brakujące wartości lub naruszenia klas danych.
Ciągły śledzenie zmian w treści i strukturze danych oraz rekurencyjnie analizowanych zmienionych danych.
Użytkownik musi wiedzieć, czy jakość danych może mieć wpływ na dokładność analizy danych lub modeli.

Użytkownicy muszą określić, które zestawy danych mają być naprawiane.
Katalogi Publikowanie zakrzywionych zasobów aplikacyjnych w celu udostępnienia ich do współużytkowania wśród współpracowników w organizacji. Do przechowywania zasobów danych, w których są wyświetlane powiązane metadane, relacje i historię zasobów aplikacyjnych, potrzebna jest centralna repozytorium.


Przykład: kuracja danych Golden Bank

Zarządcy danych w zespole zarządzania rozpoczynają importowanie metadanych w celu utworzenia zasobów danych w projekcie. Po zaimporcie metadanych Golden Bank ma dwa zasoby danych, które reprezentują tabele z kolumną o nazwie "ID". Po wzbogaceniu metadanych kolumny te są wyraźnie zróżnicowane w zależności od przypisanych im metadanych:

  • Do jednej kolumny przypisywane są terminy biznesowe "Klient handlowy" i "Identyfikator firmy", a klasa danych "Klienci o poziomie Diamentowej".
  • Do drugiej kolumny przypisywany jest termin biznesowy "Identyfikator osobisty" i "Prywatna osoba" oraz klasa danych "Numer PESEL z USA".

Zarządcy danych uruchamiają analizę jakości danych w zasobach danych, aby upewnić się, że ogólny wynik jakości danych przekracza próg złotego Banku w wysokości 95%.

Lider zespołu ds. zarządzania tworzy katalog, "katalog zatwierdzania kredytów hipotecznych" i dodaje zarządców danych i naukowców danych jako współpracowników katalogu. Zarządcy danych publikują zasoby danych, które zostały utworzone w projekcie do katalogu.

4. Znajdź i użyj danych

Katalog pomaga zespołom zrozumieć dane użytkownika i udostępnia odpowiednie dane do właściwego użycia. Analitycy danych i inni użytkownicy mogą pomóc sobie w tych danych, które są potrzebne, podczas gdy pozostają one zgodne z zasadami dostępu i ochrony danych w korporacji. Mogą one dodawać zasoby danych z katalogu do projektu, w którym współpracują w celu przygotowania, analizy i modelowania danych.

Co można użyć Co można zrobić Najlepiej używać, gdy
Katalogi Zasoby aplikacyjne należy zorganizować w celu udostępnienia ich do współużytkowania dla współpracowników w organizacji.

Należy skorzystać z wyszukiwania i rekomendacji semantycznych opartych na AI, aby pomóc użytkownikom w znalezieniu tego, czego potrzebują.
Użytkownicy muszą łatwo zrozumieć, współpracować, wzbogacać i uzyskiwać dostęp do danych o wysokiej jakości.

Chcesz zwiększyć widoczność danych i współpracę między użytkownikami biznesowymi.

Użytkownicy muszą wyświetlać, uzyskiwać dostęp do danych, manipulować nimi i analizować dane bez zrozumienia jego fizycznego formatu lub lokalizacji, a także bez konieczności przenoszenia lub kopiowania danych.

Chcesz, aby użytkownicy zwiększyli zasoby według ocen i przeglądania zasobów.
Wyszukiwanie globalne Wyszukiwanie zasobów aplikacyjnych we wszystkich projektach, katalogach i obszarach wdrażania, do których użytkownik ma dostęp.

Wyszukiwanie artefaktów zarządzania w kategoriach, do których użytkownik ma dostęp.
Konieczne jest znalezienie danych lub innego typu zasobu aplikacyjnego lub artefaktu zarządzania.
Data Refinery Należy wyczyścić dane w celu usunięcia lub usunięcia danych, które są niepoprawne, niekompletne, niepoprawnie sformatowane lub zduplikowane.

Dane kształtu w celu dostosowania go przez filtrowanie, sortowanie, łączenie lub usuwanie kolumn.
Należy poprawić jakość lub przydatność danych.


Przykład: katalog Golden Bank

Naukowcy danych znajdują zasoby danych, których potrzebują w katalogu, i kopiują te zasoby aplikacyjne do projektu. W swoim projekcie naukowcy danych mogą dopracować dane, aby przygotować go do szkolenia modelu.

Kursy dotyczące prywatności i zarządzania danymi

Samouczek Opis Ekspertyza dla kursu
Zaufanie do danych Tworzenie zaufanych zasobów danych przez wzbogacanie danych i uruchamianie analizy jakości danych. Uruchom narzędzie Metadata import i narzędzia wzbogacania metadanych.
Chroń dane Sterowanie dostępem do danych w ramach Cloud Pak for Data as a Service. Utwórz reguły ochrony danych.
Poznaj swoje dane Wartościowanie, współużytkowanie, kształtowanie i analizowanie danych. Zapoznaj się z katalogiem i uruchom narzędzie Data Refinery .
Zarządzaj zwirtualizowanymi danymi Wzbogacaj zwirtualizowane dane i upewnij się, że dane wirtualne są chronione. Do zarządzania zwirtualizowanymi danymi służy interfejs, projekty i katalogi interfejsu Watson Query .


Dowiedz się więcej o ochronie danych i zarządzaniu danymi

Temat nadrzędny: Przegląd rozwiązania dla sieci Fabric