0 / 0
Go back to the English version of the documentation
模糊处理数据方法 (屏蔽流)
Last updated: 2024年12月03日
模糊处理数据方法 (屏蔽流)

使用模糊化方法屏蔽数据会将数据值替换为与原始格式匹配的格式化值。 类似地,如果没有高级选项,那么不支持对某些数据类进行格式化输出,并将使用替代方法。

建议的最佳屏蔽方法是使用高级屏蔽和可重复及验证输入选项。 这些选项提供了很高的置信度,即屏蔽将保留格式,保持唯一性并保持引用完整性。 在整个企业中一致地屏蔽数据。

高级模糊处理选项允许您定制特定于生成掩码输出的数据类的选项,并维护几乎所有有意义的数据格式。 此方法是所有数据类的建议选项。

关于模糊处理数据选项

模糊处理方法

模糊处理方法包括保留格式和标识方法。

  • 保留格式(缺省值):按格式要求进行屏蔽,并保留特定于该数据类的最大数据利用率。
  • 标识屏蔽方法: 屏蔽任何业务标识中的字母和数字。 用字母屏蔽字母,用数字屏蔽数字,并保留字母大小写。 此方法建议用于标识数据类,如客户标识、产品标识等。 
    除了字母数字字符和一些特殊字符(如 "-./@#$ %^&*()\:;?_")外,Unicode 中所有非英语字符(双字节字符)都被屏蔽到 "X中。

一致性(可重复和随机)

使用此选项可指定屏蔽值是否与输入值一致。 要在所有数据中维护一致的屏蔽值,建议对同一输入值重复使用相同的屏蔽值。

  • 可重复:用于对重复的输入值重复同一屏蔽值。 相同的输入值将屏蔽为相同的输出值。
    例如,在所有屏蔽实例中,每次对人名 Rebecca Hsu 进行屏蔽时,屏蔽结果均返回同一人名 Jennifer Gonzalez。

  • 随机:用于为重复输入值提供随机屏蔽值。 同一个输入值被屏蔽到随机输出值。
    例如,当您屏蔽名称 Rebecca 许时,每个单独的屏蔽实例都会返回另一个随机屏蔽名称。 该名称可能会屏蔽为 Jennifer Gonzalez(对于第一个实例),然后在另一个实例中该名称可能屏蔽为 Susan Lee。

    注:

    要获取相同输入值的随机掩码值,必须将 输入验证 选项设置为 "无验证"。

输入验证(输入验证和无验证)

使用此选项可指定是否验证输入值。

  • 输入验证: 用于对与输入格式匹配的输入值进行模糊处理。 对于与输入格式不匹配的值,将进行以下验证:

    • 除去静态屏蔽方案中的行。
    • 编辑动态屏蔽方案中的值。

    例如,如果期望的格式是美国电话号码,并且其中一个值是 (19) 235-127-2318923 ,那么在静态屏蔽方案中将除去该行,因为该格式与标准美国电话号码不匹配。 在动态屏蔽方案中,值已编辑。

    限制: 要减少由于数据集中不存在输入而导致的屏蔽失败,此 输入验证 选项不可用于以下数据类:
    • 名字
    • 姓氏
    • 人员姓名
    • 美国街道名称
    • 地址行 1
    • 城市
  • 无验证:用于保留并屏蔽所有输入值,而不考虑格式。

更多特定于模糊处理的选项

根据您所选的模糊处理方法,可能会提供以下选项。 它们特定于每个方法和数据类。

  • 特定于 Preserve 格式的高级选项包括电子邮件地址和日期数据类的特殊选项。 请参阅 预留格式方法 (Preserve format method)

  • 特定于 Identifier 方法的高级选项包括:

    • 字符格式选项(可选)
    • 删除
    • 复制或替换
    限制: 在动态屏蔽期间将忽略字符格式化选项,例如 "大写" , "除去" , "修剪" 和 "复制" 或 "替换"。

请参阅 标识屏蔽方法

DateDate of Birth 数据类进行模糊处理

当数据类为 DateDate Of Birth 且已概要分析的输入数据类型为日期时,屏蔽的输出将以日期格式 (YYYY-mm-dd) 进行模糊处理。 对于其他数据类型,将以时间戳记格式 (YYYY-MM-dd HH:mm:ss.sss) 对掩码输出进行模糊处理。

模糊处理或替代屏蔽可能会还原为已编辑的值

虽然屏蔽规则创建为 "模糊处理" 或 "替代方法" ,但您可能会观察到某些数据被屏蔽为已编辑的值 " XXXXXXXXXXXX" (或基于数据类型的等效值)。 如果掩码列包含任何 NULL 值,那么将尝试对 NULL 值进行 随机模糊处理 屏蔽,而不是指定的屏蔽规则。 如果在屏蔽 NULL 或非 NULL 值期间迂到任何错误,那么会将数据屏蔽为已编辑的值。

了解更多信息

父主题: 高级数据屏蔽

Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more