Anonymisierungsknoten

Letzte Aktualisierung: 11. Feb. 2025
Anonymisierungsknoten (SPSS Modeler)

Mit dem Anonymisierungsknoten können Sie Feldnamen und/oder Feldwerte verschleiern, wenn Sie mit Daten arbeiten, die in im Knoten nachgeordnetes Modell aufgenommen werden sollen. Auf diese Weise kann das generierte Modell frei verteilt werden (beispielsweise an den Technical Support), ohne dass die Gefahr besteht, dass unbefugte Benutzer vertrauliche Daten wie beispielsweise Personalakten oder Patientenakten anzeigen können.

Je nachdem, wo Sie den Anonymisierungsknoten im Ablauf platzieren, müssen Sie möglicherweise Änderungen an anderen Knoten vornehmen. Wenn Sie beispielsweise einen einem Auswahlknoten vorgeordneten Anonymisierungsknoten einfügen, müssen die Auswahlkriterien des Auswahlknotens geändert werden, wenn sie für Werte gelten sollen, die nun anonymisiert wurden.

Die für die Anonymisierung verwendete Methode beruht auf mehreren Faktoren. Bei Feldnamen und allen Feldwerten mit Ausnahme von stetigen Messniveaus werden die Daten durch eine Zeichenfolge der folgenden Form ersetzt:


prefix_Sn

Dabei ist prefix_ entweder eine benutzerdefinierte Zeichenfolge oder die Standardzeichenfolge anon_und n ist ein ganzzahliger Wert, der bei 0 beginnt und für jeden eindeutigen Wert erhöht wird (z. B. anon_S0, anon_S1usw.).

Hinweis: Wenn Sie Daten anonymisieren wollen, die in eine Tabelle mit Beschränkungen für gültige Feldeinträge (z. B. Feldgröße) exportiert werden, prüfen Sie, ob die neue Zeichenfolge (z. B. " anon_S1) innerhalb dieser Grenzen liegt. Wenn die neue Zeichenfolge nicht in diese Grenzen passt, kann es zu Problemen beim Schreiben von Daten in nachgeschaltete Tabellen kommen.

Feldwerte mit dem Typ "Stetig" müssen transformiert werden, da sich numerische Bereiche mit ganzen oder reellen Zahlen befassen und nicht mit Zeichenfolgen. Daher können sie nur durch Transformation des Bereichs in einen anderen Bereich anonymisiert werden, wodurch die ursprünglichen Daten verschleiert werden. Die Transformation von Wert x im Bereich wird wie folgt durchgeführt:

A*(x + B)

Dabei gilt:

A ist ein Skalierungsfaktor, der größer als 0 sein muss.

B ist ein Verschiebungsoffset, der zu den Werten addiert wird.

Beispiel

Bei einem Feld AGE , bei dem der Maßstabsfaktor A auf 7 und der Verschiebungsoffset B auf 3 gesetzt ist, werden die Werte für AGE wie folgt transformiert:

7*(AGE + 3)