값 익명화 노드

마지막 업데이트 날짜: 2025년 2월 12일
익명화 노드(SPSS Modeler)

익명화 노드를 사용하면 노드의 모델 다운스트림에 포함될 데이터에 대해 작업할 때 필드 이름, 필드 값 또는 둘 다를 위장할 수 있습니다. 이러한 방식으로, 권한없는 사용자가 직원 기록 또는 환자의 의료 기록과 같은 기밀 데이터를 볼 수 있는 위험없이 생성된 모델을 예를 들어, 기술 지원에 자유롭게 분배할 수 있습니다.

플로우에서 익명화 노드를 배치하는 위치에 따라 다른 노드를 변경해야 할 수도 있습니다. 예를 들어, 선택 노드에서 업스트림으로 익명화 노드를 삽입하는 경우 선택 노드의 선택 기준이 현재 익명화된 값에 적용되면 이 기준을 변경해야 합니다.

익명화하는 데 사용하는 방법은 다양한 요인에 따라 다릅니다. 필드 이름 및 모든 필드 값(연속형 측정 수준 제외)의 경우 데이터는 다음 형식의 문자열로 대체됩니다.


prefix_Sn

여기서 prefix_는 사용자 지정 문자열 또는 기본 문자열 anon_이고, n은 0부터 시작하는 정수 값으로 각 고유 값마다 증분됩니다(예: anon_S0, anon_S1 등).

참고: 유효한 필드 항목에 제한(예: 필드 크기)이 있는 테이블로 내보내는 데이터를 익명화하려면 새 문자열(예: ' anon_S1)이 이러한 제한에 맞는지 확인하세요. 새 문자열이 이러한 제한에 맞지 않으면 다운스트림 테이블에 데이터를 쓰는 데 문제가 발생할 수 있습니다.

숫자 범위가 문자열이 아닌 정수 또는 실수 값을 처리하므로 유형이 연속형인 필드 값을 변환해야 합니다. 이러한 방식으로 범위를 다른 범위로 변환하므로 원래 데이터를 위장해야만 이를 익명화할 수 있습니다. 범위에서 값 x의 변환은 다음과 같은 방식으로 수행됩니다.

A*(x + B)

상황:

A는 0보다 커야 하는 환산 계수입니다.

B는 값에 추가할 변환 오프셋입니다.

환산 계수 A가 7로 설정되고 변환 오프셋 B가 3으로 설정되는 필드 AGE의 경우 AGE의 값이 다음으로 변환됩니다.

7*(AGE + 3)