데이터 보호 규칙을 사용하여 가상 데이터를 마스크할 수 있습니다. 조회되면 마스크된 열이 위장된 데이터를 리턴합니다.
데이터 마스킹은 조회의 결과 세트에만 적용됩니다. 테이블 및 컬럼의 원래 데이터는 그대로 유지됩니다. 조회 술어 또는 보기에는 마스킹이 적용되지 않습니다. 데이터 마스킹을 사용하여 중요한 데이터가 노출되지 않도록 할 수 있습니다. 그러나 데이터 마스킹은 Data Virtualization 사용자가 서비스에 연결하여 해당 데이터에 대한 쿼리를 실행하는 것을 막지는 못합니다. 사용자는 데이터를 결합 및 그룹화하고 보고서를 생성하고 분석을 수행하며 결과 세트만 마스킹하는 동안 원시 데이터를 사용하여 통찰력을 수집할 수 있습니다.
데이터 마스킹 규칙은 Data Virtualization 다음 객체에만 적용됩니다:
- 가상화된 객체
- 원시 Db2® 테이블
- 구체화된 쿼리 테이블(MQT)
데이터 마스킹 방법에 따라 데이터가 수정, 대체 또는 난독화됩니다. 자세한 내용은 Data Virtualization 데이터 보호 규칙으로 가상 데이터 관리하기를 참조하세요. 가상화된 데이터의 열 이름 옆에 있는 잠금 아이콘 () 은 열의 데이터가 데이터 보호 규칙에 의해 마스크됨을 표시합니다.
지원되는 마스킹 조치
- 교정 (기본)
- 수정 조치 데이터 맵핑
- 다음 목록은 Data Virtualization 편집 작업에 매핑되는 데이터 유형에 대해 설명합니다.
- VARCHAR은 'XXXXXXXXXX' 또는 둘 중 더 짧은 'X' * 컬럼 길이에 마스킹됩니다.
- CHAR은 'XXXXXXXXXX' 또는 둘 중 더 짧은 'X' * 컬럼 길이에 마스킹됩니다.
- 숫자 데이터 유형은 0으로 마스크됩니다.
- DATE는 '2001-01-01' 로 마스크됩니다.
- 시간은 '00:00:00'에 마스킹됩니다.
- TIMESTAMP가 DATE ('2001-01-01 00:00:00.0') 로 마스크됩니다.
- BOOLEAN은 "False" 로 수정됩니다.
- 부분 교정 (고급)
- 대체
- 대체 조치 데이터 맵핑
- CHAR, VARCHAR
- 대체 마스킹 조치는 솔트된 sha256 해시를 기반으로 하며 CHAR/VARCHAR열과 함께 사용되는 경우 base64 로 인코딩됩니다. 충돌을 방지하려면 컬럼 길이가 최소한 43바이트여야 합니다 (동일한 출력을 생성하는 두 개의 구별 입력).
- SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT
- 대체는 원래 값의 숫자 해시를 표시합니다. 결과 값에 선행 "0"이 있으면 0이 표시되지 않습니다. 예를 들어, "02"의 마스킹된 값은 "2"로만 표시됩니다.
- 날짜, 시간소인
- 대체는 원래 값의 해시된 표시를 표시합니다.
- CLOB, BLOB, BINARY, VARBINARY
NULL
(또는 열이NOT NULL
로 정의된 경우 비어 있는 값)- 기타 데이터
- 수정 조치로 폴백합니다.
- 난독화 (기본)
- 난독화 (고급)
- 되돌릴수 있는 마스킹
- 식별자 메소드가 있는 문자 형식화 옵션
- 형식 유지
- 되돌릴수 없는 마스킹
- 반복 가능한 일관성
- 무작위 일관성
- 입력 유효성 검증
- 식별자 메소드
난독화 및 고급 마스킹 옵션의 경우 다음 데이터 클래스가 지원됩니다.
- 개인 이름
- 이름
- 성
- 이름 접미부
- 존칭어
- 성별
- 이메일 주소
- 생년월일
- 운전 면허증
- 모든 50개의 미국 주 운전 면허증 번호 형식
- 미국 사회보장번호
- 미국 사회보장번호 마지막 4자리
- 인종
- 눈 색상
- 머리카락 색상
- 취미/레저 활동
- 법적 혼인/시민 상태
- 정당
- 고용 상태
- 관계
- 종교
- ISO 369에 따른 언어 코드 또는 이름
- 조직 이름
- Dun & Bradstreet 비즈니스 ID
- DUNS 번호
- 포춘 1000 기업
- 국제 상업 조건
- 생산자부호(CAGE 코드)
- 주소 라인
- 주소 행 1
- 주소 라인 2
- 주소 3
- 국가 이름
- 국가 코드
- 미국 거리 이름
- 미국 주 수도 이름
- 미국 우편번호
- 미국 전화번호
- 미국 주 코드
- 미국 주 이름
- 미국 카운티 이름
- 주 이름
- 구/군/시 (영어)
- 캐나다 주 코드
- 캐나다 주 이름
- 위도
- 경도
- ISO 3166-2시/도 코드
- 인터넷 프로토콜 주소
- 인터넷 프로토콜 버전 6 주소
- 은행 ID 코드
- 계정 번호
- 신용카드 번호
- 비자 카드 신용 카드
- American Express 신용 카드
- 마스터 카드 신용 카드
- Discover Card 신용카드
- Diners Club 신용카드
- 일본 신용 카드
- 날짜
- 날짜/시간
- 월
- 온도
- 독일 차량 등록 번호
- 질병의 국제 통계 분류 v10
사용 참고
- Data Virtualization 데이터 마스킹 지원은 다음 데이터 유형으로 제한됩니다:
- 문자열 (CHAR, VARCHAR)
- 숫자(SMALLINT, INT, BIGINT, DECIMAL, DOUBLE, REAL, DECFLOAT)
- 날짜 및 시간 (DATE, TIMESTAMP)
- 부울
- 데이터 유형 TIME의 컬럼은 마스킹 규칙이 정의되는 방법에 관계없이 항상 00:00:00.000 으로 마스크됩니다.
- CLOB, BLOB, BINARY및 VARBINARY 유형의 컬럼은 마스킹 조치에 관계없이
NULL
(또는 컬럼이NOT NULL
로 정의된 경우 비어 있는 값) 로 마스크됩니다. - SQL문의 WHERE, GROUP BY, JOIN, HAVING, SELECT DISTINCT및 ORDER BY절과 같은 쿼리 술어에는 마스킹이 적용되지 않습니다.
- 데이터 마스킹 규칙을 적용하려면 가상 개체를 관리되는 카탈로그에서 캡처하고 Data Virtualization 연결 유형을 사용해야 합니다.
- 데이터 마스킹 규칙은 뷰에 직접 적용할 수 없습니다. 뷰의 결과 세트는 뷰에서 참조하는 오브젝트에 적용되는 데이터 보호 규칙에 따라 마스크됩니다. 뷰 정의에서 참조되는 테이블에서 식별 세부사항을 마스크할 수 있습니다.
- 모든 숫자 데이터 유형의 컬럼을 부분적으로 포함하여 교정하면 마스킹이 0으로 설정됩니다.
- 규칙 빌더 사용자 인터페이스를 사용하여 데이터 보호 규칙을 정의하십시오. Data Virtualization Data Virtualization 데이터 보호 규칙으로 가상 데이터 관리하기에서 설명하는 부분 삭제 옵션을 지원합니다.
- 올바른 결과를 얻으려면 열 정의에 적절한 데이터 클래스 지정을 사용하십시오. 예를 들어, 우편번호 데이터 클래스를 DECIMAL 유형의 열에 지정하지 마십시오.
- 지원되지 않는 데이터 클래스의 난독화는 항상 ID 마스킹을 수행하며, 이는 문자가 있는 문자 및 숫자가 있는 숫자를 마스크하고 문자 대소문자를 유지합니다.
NULL
값이 대체되거나 난독화되면 지원되는 데이터 클래스가 있는 컬럼에 대해 무작위 값이 제작됩니다 (비결정적). 지원되지 않는 데이터 클래스가 있는 열의NULL
값은 표준 교정으로 대체됩니다.- ID 마스킹 메소드가 난독화와 함께 사용되면 비어 있는 값이 수정됩니다.
- SUM과 같은 집계 함수로 인해 대체 마스킹에서 숫자 오버플로우가 발생할 수 있습니다. 다음 예에 표시된 대로 컬럼을 더 높은 등급 유형으로 캐스트할 수 있습니다.
SELECT SUM(CAST(VALUE AS DECIMAL(31,0))) FROM PROJECT1.CUSTOMERS
- 난독화 규칙에서 입력 유효성 검증 옵션을 사용하는 경우 내부 사전에 알려지지 않은 입력 값은 유효하지 않은 것으로 간주되며 대신 교정 이 수행됩니다.
- 교정은 최상의 성능을 제공합니다. 대체 및 난독화는 고급 알고리즘을 사용하므로 오버헤드가 커집니다.
EXCEPT
,EXCEPT ALL
,INTERSECT
,INTERSECT ALL
또는UNION
세트 연산자와 관련된 세트 조작에서 파생된SELECT
(뷰 포함)에서는 마스크된 열을 사용할 수 없습니다.
제한사항
- 중요:
'' 데이터 Data Virtualization 이외의 ' Watson 서비스, ' Cloud Pak for Data '(예: IBM Knowledge Catalog, ' Watson Studio, ' Data Refinery' )에서 데이터 Data Virtualization 데이터 자산을 미리 보기, 다운로드 또는 정제하는 경우, 데이터 마스킹 또는 행 수준 필터링이 적용되는 경우에는 데이터 보호 규칙 및 카탈로그 또는 프로젝트 액세스 제어만 미리 보기에 적용됩니다. Data Virtualization 액세스 제어는 적용되지 않습니다.
Data Virtualization 가상화 액세스 제어는 데이터 마스킹 또는 행 수준 필터링이 ' Watson 서비스( Data Virtualization 제외)의 미리 보기에 적용되는 경우 적용되지 않습니다. Data Virtualization UI에서 액세스 관리를 사용하여 제어되는 Data Virtualization 내부 액세스 제어는 마스킹 또는 행 수준 필터링이 있는 다른 ' Watson ' 서비스의 미리 보기에는 적용되지 않습니다. 다른 Watson 서비스에서 액세스 제어를 위한 카탈로그, 프로젝트, 데이터 자산 또는 연결에 대한 액세스를 관리하기 위한 규칙을 정의해야 합니다.
- ID 마스킹 메소드는 멀티바이트 문자에서 지원되지 않습니다. 원래 복수 바이트 문자가 리턴됩니다.
- 멀티바이트 문자를 1바이트로 마스크하거나 1바이트문자를 멀티바이트로 마스크할 때 예기치 않은 결과가 나타날 수 있습니다.
- Data Virtualization 사용자 지정 데이터 클래스의 마스킹이 지원되지 않습니다. ID 마스킹 메소드가 대신 사용됩니다.
- 난독화의 문자 형식화 옵션은 지원되지 않으며 문자와 숫자로 문자를 마스크하고 문자 대소문자를 유지하는 ID 마스킹이 대신 수행됩니다.
- 경우에 따라 카탈로그 또는 프로젝트의 마스크된 미리 보기는 Data Virtualization 다를 수 있습니다.