Go back to the English version of the documentation“匿名化”节点
匿名化节点 (SPSS Modeler)
Last updated: 2024年11月22日
利用“匿名化”节点,您处理要在该节点下游包括到模型中的数据时,可以隐藏字段名称和/或字段值。 这样,可以随意分发所生成的模型(例如,分发至技术支持部门),而未授权用户无法查看机密数据(例如,员工记录或患者的医疗记录)。
您可能需要对其他节点进行更改,具体取决于“匿名化”节点在流程中的位置。 例如,如果通过使用“选择”节点在上游中插入一个匿名化节点,那么该“选择”节点中的选择标准作用于现已匿名化的值时,这些标准需要进行更改。
用于匿名化的方法取决于多种因素。 对于字段名称以及除“连续”测量级别外的所有字段值,数据将替换为以下形式的字符串:
prefix_Sn
其中 prefix_
是用户指定的字符串或缺省字符串 anon_
,n
是从 0 开始并在遇到每个唯一值时递增的整数值(例如,anon_S0
、anon_S1
等)。
注意:如果要对导出到对有效字段条目有限制(如字段大小)的表中的数据进行匿名化,请检查新字符串(如 "
anon_S1
)是否符合这些限制。 如果新字符串不符合这些限制,那么向下游表中写入数据时可能会出现问题。类型为“连续”的字段值必须进行变换,因为数值范围处理的是整数或实数值,而不是字符串。 因此,只能通过将范围变换为不同范围对字段值进行匿名化,从而掩饰原始数据。 范围内的值 x
的变换按以下方法执行:
A*(x + B)
其中:
A
是比例因子,必须大于 0。
B
是要为值增加的转换偏移量。
示例
对于 AGE
字段,如果比例因子 A
设置为 7 而转换偏移量 B
设置为 3,那么 AGE
的值将转换为:
7*(AGE + 3)