0 / 0
Go back to the English version of the documentation
Maskuj dane za pomocą reguł ochrony danych (Watson Knowledge Catalog)
Last updated: 03 lis 2023
Maskuj dane za pomocą reguł ochrony danych (Watson Knowledge Catalog)

Aby dane były maskowane, muszą być zgodne z następującymi wymaganiami:

  • Dane są ustrukturyzowane. Dane muszą znajdować się w tabelach relacyjnych lub plikach CSV, Avro, danych partycjonowanych lub Parquet.
  • Nagłówki kolumn zawierają tylko znaki alfanumeryczne (a-z, A-Z, 0-9). Nagłówki kolumn nie mogą zawierać nieobsługiwanych znaków, takich jak znaki wielobajtowe lub znaki specjalne.

Po wybraniu działania maskowania należy określić kryteria maskowania i metodę maskowania.

Kryteria maskowania

Kryteria maskowania identyfikują kolumny do zamaskowania. Należy wybrać typ właściwości kolumny i określić jedną lub więcej konkretnych wartości właściwości, które są logicznie połączone operatorem OR .

Typ właściwości kolumny Opis Konkretne wartości
Termin biznesowy Termin biznesowy przypisany do kolumny. Wyszukaj, a następnie wybierz co najmniej jeden opublikowany termin biznesowy.
klasa danych Klasa danych przypisana do kolumny. Wyszukaj, a następnie wybierz co najmniej jedną opublikowaną klasę danych.
Znacznik Znacznik przypisany do kolumny w zasobie aplikacyjnym. Wprowadź jeden lub więcej znaczników rozdzielonych przecinkami.
Nazwa kolumny Nazwa kolumny. Wprowadź jedną lub więcej nazw kolumn, rozdzielając je przecinkami.

Załóżmy na przykład, że wybrano właściwość kolumny klasy Data i konkretne wartości licencji California State Driver's License i Nevada State Driver's License. Wartości są następnie zamaskowane w kolumnach, które mają przypisaną klasę danych "California State Driver's License" lub "Nevada State Driver's License".

Przegląd metod maskowania

Główne różnice między metodami maskowania to ilość pierwotnych cech danych. Im bardziej oryginalna charakterystyka danych jest zachowana, tym bardziej użyteczne, ale mniej bezpieczne stają się dane maskowane. Wybierając metodę maskowania, należy wziąć pod uwagę następujące czynniki:

  • Integralność danych: określa, czy ta sama wartość maskowana ma być powtarzana dla wartości oryginalnej, aby zachować spójność referencyjną między tabelami.

  • Format danych: określa, czy zachować format oryginalnych danych. Zachowanie formatu oznacza, że litery są zastępowane przez litery o tej samej wielkości, cyfry są zastępowane przez cyfry, a liczba znaków jest taka sama.

W poniższej tabeli opisano, w jaki sposób każda metoda maskowania wpływa na te parametry.

Metoda Opis Zachowuje integralność? Zachowuje format danych?
Redaguj Domyślnie zastępuje wartości dziesięcioma znakami X. Najbardziej bezpieczna metoda.
Dane można również redagować za pomocą zaawansowanych opcji maskowania. Można dostosować znak zastępujący i liczbę znaków zastępujących. W przypadku kolumn, do których przypisano niektóre klasy danych, można wybrać częściowe zastępowanie.
Nie Nie: jeśli nie są używane zaawansowane opcje maskowania.
Tak: jeśli są używane zaawansowane opcje maskowania.
PODSTAW Zastąp wartości losowo wygenerowanymi wartościami, które zachowują spójność referencyjną. Tak Nie
Ukryj Zastąp wartości wartościami zachowującymi spójność referencyjną i oryginalny format danych. Metoda najmniej bezpieczna. Tak Tak

W przypadku danych wirtualnych zachowanie maskowania jest nieco inne w zależności od definicji pola danych. Patrz Maskowanie danych wirtualnych.

Redaguj

Dane można redagować przy użyciu dwóch różnych metod.

  • Podstawowa metoda redagowania zastępuje każdą wartość danych łańcuchem zawierającym dokładnie dziesięć liter X. W przypadku zredagowanych danych format danych i integralność danych nie są zachowywane. Maskowanie jest najbezpieczniejszą metodą maskowania, ale powoduje, że dane maskowane są najmniej użyteczne.

    Na przykład numer telefonu 510-555-1234 jest zastępowany przez XXXXXXXXXX. Wszystkie pozostałe numery telefonów są zastępowane tą samą wartością.

  • Istnieje możliwość określenia zaawansowanych opcji utajniania dla kryteriów, które są oparte na klasach danych z zaawansowanymi opcjami maskowania. W przeciwieństwie do domyślnej metody maskowania, znaki zastępcze używane do maskowania danych zależą od konkretnych znaków skonfigurowanych do maskowania danych. Można również określić liczbę znaków do zamaskowania danych. W przypadku zaawansowanych danych z utajnieniem format danych nie jest zachowywany, ale zachowywana jest integralność danych.

    Na przykład, jeśli typem kolumny jest liczba całkowita, a wartość 0 jest skonfigurowana dla redagowanych liczb całkowitych, dane są redagowane za pomocą 0000000000. Jeśli typem kolumny jest łańcuch, a X jest skonfigurowany do redagowania łańcuchów, dane są redagowane za pomocą XXXXXXXXXX. Jeśli typ kolumny jest skonfigurowany dla daty, a 2022-06-30 dla daty utajnienia, dane są redagowane za pomocą daty 2022-06-30.

    Jednak zaawansowane opcje maskowania nie są wymuszane automatycznie. Należy go zastosować do wybranych zasobów danych w projekcie, a następnie opublikować zamaskowane zasoby aplikacyjne w katalogu.

PODSTAW

Metoda zastępcza zastępuje dane wartościami, które nie są zgodne z oryginalnym formatem. Jednak zachowuje on spójność referencyjną dla powtarzających się wartości dla wszystkich zasobów aplikacyjnych w katalogu. Podstawione wartości nie mają znaczenia i nie można określić ich oryginalnego formatu. Zamiennik zapewnia bezpieczeństwo i przydatność danych między metodami Redact i Obfuscate.

Na przykład numer telefonu 510-555-1234 jest zawsze zastępowany numerem 500ddcc98133703531re3456.

Zaciemnij

Metoda zaciemniania zastępuje wartości danych wartościami w podobnym formacie, które są zgodne z oryginalnym formatem i zachowuje spójność referencyjną dla powtarzających się wartości. Ponieważ zaciemnione wartości są w podobny sposób sformatowane, mogą być poprawnymi wartościami. Zaciemnianie jest najmniej bezpieczną metodą maskowania, ale daje w wyniku najbardziej użyteczne dane maskowane.

Na przykład numer telefonu 510-555-1234 jest zawsze zastępowany numerem 415 -987-6543.

Jednak metoda zaciemniania jest ograniczona do wartości danych w kolumnach, które mają przypisane klasy danych z następującymi typami informacji:

  • Dane osobowe, na przykład podstawowe atrybuty osoby, takie jak honorific lub przyrostek nazwy.
  • Dane kontaktowe, na przykład adresy e-mail, numery telefonów, województwo, adresy pocztowe, szerokość lub długość geograficzna.
  • Konta finansowe, na przykład karty kredytowe, bankowość lub inne numery kont finansowych.
  • Tożsamości rządowe, na przykład osobiste numery identyfikacyjne wydawane przez rządy, takie jak SSN (numery ubezpieczenia społecznego USA) i CCN (numery kart kredytowych).
  • Osobiste dane demograficzne, na przykład religia, pochodzenie etniczne, stan cywilny, hobby lub status pracownika.
  • Dane dotyczące połączeń, na przykład adres IP lub adres MAC.

Jeśli tworzona jest reguła zaciemniania danych, a reguła jest wymuszana dla danych, do których nie jest przypisana klasa danych obsługująca zaciemnianie, zamiast niej używana jest metoda zastępcza.

Można określić zaawansowane opcje zaciemniania dla kryteriów maskowania, które są oparte na klasach danych z zaawansowanym maskowaniem danych. Jednak zaawansowane maskowanie danych nie jest wymuszane automatycznie. Należy go zastosować do wybranych zasobów danych w projekcie, a następnie opublikować zamaskowane zasoby aplikacyjne w katalogu.

Więcej inform.

Temat nadrzędny: Reguły ochrony danych

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more