고급 마스킹 옵션은 고급 식별 해제 기술을 사용하여 데이터를 보호함으로써 데이터 보호 규칙 및 데이터 위치 규칙의 기능을 확장합니다. 이 기법은 데이터의 형식과 무결성을 유지합니다. 높은 데이터 효용성으로 인해 데이터 과학자, 비즈니스 분석가 및 애플리케이션 개발자와 같은 데이터 사용자가 보호된 데이터에서 고품질의 인사이트를 생성할 수 있습니다.
고급 마스킹 옵션에는 다음 기능이 포함됩니다.
- AI 프로젝트에 대한 효용성을 유지하기 위한 사전 정의된 165개 데이터 클래스의 형식 유지 비식별화
고급 마스킹 옵션으로 정의된 데이터 보호 규칙은 IBM Data Virtualization 적용됩니다. 규칙은 IBAN
및 URL
를 제외하고 사전 정의된 데이터 클래스에서 난독화를 유지하는 형식을 구현할 수 있습니다.
- 관련된 데이터 소스에서 데이터를 일관되게 보호하기 위한 관계 무결성
다음 시나리오는 고급 마스킹 옵션이 데이터 보호 규칙의 기능을 확장하는 방법을 설명합니다.
데이터 과학자들은 사기 거래를 예측하기 위해 머신 러닝 모델의 신용카드 번호와 은행 계좌 번호와 같은 금융 데이터를 사용하고자 합니다. 데이터 사용자가 찾고 있는 결과를 생성하기 위해서는 신용카드 번호가 XXXXXXXXX일 수 없습니다. 대신 실제 신용카드 번호가 필요합니다. 고급 마스킹 opion의 preserve format 메소드는 형식 요구사항을 충족하는 신용 카드 번호를 생성합니다. 형식 요구사항으로는 발행 ID 정보(카드를 발행한 신용카드 회사(Visa, Mastercard 등) 지정), luhn 체크섬 알고리즘 등의 유지가 있습니다. 사실적인 마스킹은 데이터 사용자가 정확한 결과를 생성하도록 보장합니다.
의료 데이터 사용자는 환자의 이름과 주소 정보를 포함하는 환자 데이터를 사용하여 터미널 질병 임상 연구 결과를 분석하려고 합니다. 환자의 이름은 찾고 있는 결과를 생성하기 위해 "XXXX"로 마스크할 수 없습니다. 대신에 실제 이름과 실제 상세 주소, 구/군/시 및 국가가 필요합니다. 그 결과, 데이터 사용자들이 분석을 수행하고 있을 때, 그들은 "123 메이플 레인"에 살고 있는 "Jane Doe"가 유방암을 앓는 연구 참가자라는 더 넓은 맥락을 갖습니다.
고급 마스킹 옵션의 특수성 때문에 이러한 옵션은 한 번에 하나의 데이터 클래스에만 적용될 수 있습니다. 이러한 옵션은 모든 165개의 사전 정의된 IBM Knowledge Catalog 데이터 클래스에 대해 최적화되어 있으며 각 데이터 클래스에 대해 최상의 형식 보존 옵션으로 권장됩니다. 그러나 사용자 정의 IBM Knowledge Catalog 데이터 클래스에는 적용할 수 없습니다.
고급 마스킹 옵션은 개정 및 난독화 마스킹 방법에만 사용할 수 있습니다. 고급 마스킹 옵션은 mask data in columns containing data class
을(를) 사용하여 규칙에 적용됩니다. 비즈니스 용어, 열 이름 및 태그는 아직 지원되지 않습니다.
고급 마스킹 옵션을 사용하여 데이터 보호 규칙 작성
고급 마스킹 옵션은 데이터 클래스에만 사용 가능합니다.
조건을 완성하고 처리하려는 속성을 선택하십시오. 권장하는 사례는 다음 방법 중 하나로 규칙을 작성하는 것입니다.
데이터 클래스에
__insert data class__
이(가) 있는 경우 데이터 클래스__insert data class__
을(를) 포함하는 열의 데이터를 마스크합니다.자산 소유자, 비즈니스 용어, 태그 등에 대한 조건을 선택적으로 추가할 수 있지만 이러한 거버넌스 아티팩트의 작동 방식을 이해해야 함을 명심하십시오. 의도치 않게 마스킹되지 않은 데이터를 유출할 수 있습니다. 데이터 보호 규칙 관리를 참조하십시오.
작은 입력 데이터 (예: 부울 값 또는 한 자리 숫자) 를 마스킹하면 마스킹 플로우 작업을 실행하거나 데이터를 미리 보거나 다운로드할 때 데이터가 마스킹되지 않은 것처럼 보일 수 있습니다. 그러나 데이터는 마스크되고 마스크된 값은 마스크되지 않은 값과 동일합니다.
데이터를 마스킹하기 위한 다음 방법을 선택하십시오.
- 컬럼 수정
- 컬럼 난독 처리
대체는 고급 마스킹에 지원되지 않습니다.
고급 마스킹 옵션 섹션에서 마스킹 옵션을 선택하십시오. 일부 옵션은 기본적으로 선택되어 있습니다. 자세한 정보는 데이터 개정 방법 및 데이터 난독화 방법을 참조하십시오.
규칙을 작성하십시오. 자산의 데이터를 마스크하는 방법에 대한 자세한 정보는 마스크 데이터 를 참조하십시오.
마스킹 미리보기 사용
예제 데이터 섹션의 미리보기 전에는 카탈로그, 프로젝트에서 데이터 자산을 볼 때 데이터가 마스킹되는 방법과 마스킹 플로우 작업을 실행하기 전에 동적으로 데이터가 마스킹되는 방법을 표시합니다. 예제 데이터 섹션의 이후 미리보기는 마스킹 플로우 작업을 실행하여 생성되는 마스킹된 사본에서 데이터가 마스킹되는 방법을 표시합니다.
프로젝트의 마스킹 플로우 자산을 작성하고 고급 마스킹 옵션을 설정하는 방법을 보려면 이 동영상을 시청하십시오.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
다음 단계
자세한 정보
상위 주제: 데이터 보호 규칙