0 / 0
Go back to the English version of the documentation
“匿名化”节点
Last updated: 2024年11月22日
匿名化节点 (SPSS Modeler)

利用“匿名化”节点,您处理要在该节点下游包括到模型中的数据时,可以隐藏字段名称和/或字段值。 这样,可以随意分发所生成的模型(例如,分发至技术支持部门),而未授权用户无法查看机密数据(例如,员工记录或患者的医疗记录)。

您可能需要对其他节点进行更改,具体取决于“匿名化”节点在流程中的位置。 例如,如果通过使用“选择”节点在上游中插入一个匿名化节点,那么该“选择”节点中的选择标准作用于现已匿名化的值时,这些标准需要进行更改。

用于匿名化的方法取决于多种因素。 对于字段名称以及除“连续”测量级别外的所有字段值,数据将替换为以下形式的字符串:


prefix_Sn

其中 prefix_ 是用户指定的字符串或缺省字符串 anon_n 是从 0 开始并在遇到每个唯一值时递增的整数值(例如,anon_S0anon_S1 等)。

注意:如果要对导出到对有效字段条目有限制(如字段大小)的表中的数据进行匿名化,请检查新字符串(如 "anon_S1)是否符合这些限制。 如果新字符串不符合这些限制,那么向下游表中写入数据时可能会出现问题。

类型为“连续”的字段值必须进行变换,因为数值范围处理的是整数或实数值,而不是字符串。 因此,只能通过将范围变换为不同范围对字段值进行匿名化,从而掩饰原始数据。 范围内的值 x 的变换按以下方法执行:

A*(x + B)

其中:

A 是比例因子,必须大于 0。

B 是要为值增加的转换偏移量。

示例

对于 AGE 字段,如果比例因子 A 设置为 7 而转换偏移量 B 设置为 3,那么 AGE 的值将转换为:

7*(AGE + 3)
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more