Translation not up to date
Węzeł Anonimizacja umożliwia ukrycie nazw pól, wartości pól lub obu tych wartości podczas pracy z danymi, które mają być uwzględnione w modelu znajdującym się poniżej węzła. W ten sposób wygenerowany model może być swobodnie rozdzielany (np. do działu wsparcia technicznego) bez ryzyka, że nieuprawnieni użytkownicy będą mogli zobaczyć poufne dane, takie jak rekordy pracowników czy dokumentacja medyczna pacjentów.
W zależności od miejsca, w którym umieszczany jest węzeł Anonimizacja w przepływie, może być konieczne wprowadzenie zmian w innych węzłach. Przykładowo, jeśli węzeł Anonimizacja zostanie wstawiony przed węzłem Selekcja, kryteria wyboru w węźle selekcji będą wymagały zmiany, jeśli oddziałują na wartości, które teraz zostaną poddane anonimizacji.
Metoda, jakiej należy użyć do anonimizacji, zależy od różnych czynników. W przypadku nazw pól i wszystkich wartości pól z wyjątkiem ciągłych poziomów pomiaru, dane są zastępowane przez łańcuch formularza:
prefix_Sn
gdzie prefix_
jest łańcuchem określonym przez użytkownika lub łańcuchem domyślnym anon_
, a n
jest liczbą całkowitą, która rozpoczyna się od 0 i jest zwiększana dla każdej unikalnej wartości (na przykład: anon_S0
, anon_S1
itd.).
Wartości zmiennych typu ilościowego muszą zostać poddane transformacji, ponieważ przedziały liczbowe mogą być przetwarzane z wartościami całkowitymi lub rzeczywistymi, a nie z łańcuchami. Dlatego mogą zostać poddane anonimizacji poprzez transformację przedziału na inny przedział, który zamaskuje oryginalne dane. Transformacja wartości x
w przedziale odbywa się w następujący sposób:
A*(x + B)
gdzie:
A
jest czynnikiem skalującym, który musi być większy od 0.
B
jest przesunięciem translacji, jakie zostanie dodane do wartości.
Przykład
W przypadku zmiennej AGE
(Wiek), w której czynnik skalujący A
jest ustawiany na wartość 7, a przesunięcie translacji B
jest ustawiane na wartość 3, wartości AGE
zostaną przetransformowane w następujący sposób:
7*(AGE + 3)