資料の 英語版 に戻る匿名化ノード
匿名化ノード (SPSS Modeler)
最終更新: 2024年11月22日
匿名化ノードを使用すると、そのノードのモデル・ダウンストリームに含まれるデータを操作する場合に、フィールド名やフィールド値を匿名化することができます。 これにより、権限を持たないユーザーが従業員の記録や患者の治療記録など機密データを閲覧する危険なく、生成されたモデルを自由に(例えばテクニカル・サポートへ)分散させることができます。
フローの匿名化ノードの場所によっては、他のノードに変更する必要があります。 例えば条件抽出ノードの上流に匿名化ノードを挿入する時、条件抽出ノードの選択基準を匿名化された値に実行する場合に変更する必要があります。
匿名化で使用される方法は、様々な要素によって決まります。 フィールド名、および連続型尺度以外のすべてのデータ値について、データは次の形式の文字列に置換されます。
prefix_Sn
prefix_
は、ユーザー指定の文字列またはデフォルトの文字列 anon_
で、n
は、0 から開始してそれぞれの一意値まで増加する整数の値です (anon_S0
や anon_S1
など)。
注意:有効なフィールド項目(フィールド・サイズなど)に制限があるテーブルにエクスポートするデータを匿名化したい場合は、新しい文字列(例えば、'
anon_S1
)が制限内に収まることを確認してください。 新しい文字列がこれらの制限に合わない場合、下流のテーブルにデータを書き込む際に問題が発生する可能性がある。数値の範囲は文字列より整数または実数値に対応しているため、範囲型のフィールド値を変換する必要があります。 フィールド値はその範囲を異なる範囲に変換することによってのみ匿名化することができ、元のデータを隠します。 範囲内にある値 x
の変換は、次のように行われます。
A*(x + B)
ここで、
A
は、0 より大きい換算係数です。
B
は値に追加する翻訳オフセットです。
例
換算係数 A
が 7 に、翻訳オフセット B
が 3 に設定されているフィールド AGE
の場合、AGE
の値は次のように変換されます。
7*(AGE + 3)