0 / 0
Retourner à la version anglaise de la documentation
Noeud Anonymiser
Dernière mise à jour : 21 nov. 2024
Noeud Anonymiser (SPSS Modeler)

Avec le noeud Anonymiser, vous pouvez masquer les noms et/ou les valeurs de zone lorsque vous manipulez les données à inclure dans un modèle situé en aval du noeud. De cette façon, vous pouvez distribuer librement le modèle généré (par exemple à l'assistance technique) sans craindre que des utilisateurs non autorisés aient la possibilité de visualiser des données confidentielles telles que les fichiers du personnel ou les dossiers médicaux de patients.

Selon l'endroit où vous placez le noeud Anonymiser dans le flux, il se peut que vous deviez apporter des changements à d'autres noeuds. Par exemple, si vous insérez un noeud Anonymiser en amont d'un noeud Sélectionner, les critères de sélection de ce dernier doivent être modifiés s'ils agissent sur des valeurs qui sont désormais anonymisées.

La méthode à utiliser pour l'anonymisation dépend de plusieurs facteurs. Pour les noms de champ, ainsi que pour toutes les valeurs de champ excepté les niveaux de mesure continus, les données sont remplacées par une chaîne du type :


prefix_Sn

prefix_ est une chaîne spécifiée par l'utilisateur ou la chaîne par défaut anon_, et n est une valeur entière qui commence à 0 et est incrémentée pour chaque valeur unique (par exemple, anon_S0, anon_S1, etc.).

Remarque : si vous souhaitez rendre anonymes des données exportées vers une table dont les entrées de champ valides sont limitées (par exemple, la taille du champ), vérifiez que la nouvelle chaîne (par exemple, " anon_S1) respecte ces limites. Si la nouvelle chaîne ne correspond pas à ces limites, vous risquez de rencontrer des problèmes pour écrire des données dans les tables en aval.

Les valeurs de champ du type Continu doivent être transformées car les intervalles numériques se rapportent à des valeurs entières ou réelles plutôt qu'à des chaînes. En tant que telles, elles peuvent être anonymisées uniquement par la transformation de l'intervalle en un intervalle différent. Les données d'origine sont ainsi masquées. La transformation d'une valeur x de l'intervalle est exécutée de la façon suivante :

A*(x + B)

où :

A est un facteur d'échelle, obligatoirement supérieur à 0.

B est un décalage de traduction à ajouter aux valeurs.

Exemple

Soit un champ AGE avec le facteur d'échelle A défini sur 7 et le décalage de traduction B défini sur 3, les valeurs relatives à AGE sont transformées de la façon suivante :

7*(AGE + 3)
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus