학습서: 데이터 보호

이 학습서를 통해 데이터 패브릭 평가판의 Data Governance and Privacy 사용 사례로 데이터를 보호하십시오. 목표는 데이터 패브릭의 서비스 간에 데이터에 대한 액세스를 제어하는 것입니다.

이 학습서의 내용은 골든 뱅크에는 고품질의 고객 모기지 데이터에 대한 액세스가 필요한 여러 부서가 있다는 점입니다. 거버넌스 팀의 데이터 스튜어드는 기밀 모기지 데이터를 보호하기 위해 데이터 보호 규칙을 작성하고 마스킹 플로우를 빌드합니다.

이 학습서에서는 다음 태스크를 완료합니다.

  1. 액세스를 거부하는 데이터 보호 규칙을 작성하십시오.
  2. 데이터를 마스크할 데이터 보호 규칙을 작성합니다.
  3. 데이터를 프로젝트로 가져옵니다.
  4. 데이터를 강화합니다.
  5. 메타데이터 강화의 결과를 보십시오.
  6. 카탈로그를 작성합니다.
  7. 카탈로그에 자산을 공개합니다.

이 학습서에 대한 도움말이 필요한 경우 질문을 하거나 Cloud Pak for Data 커뮤니티 토론 포럼에서 답을 찾으십시오.

팁: 이 학습을 완료하는 최적의 경험을 보려면 Cloud Pak for Data as a Service를 하나의 브라우저 탭에서 열고 이 학습서 페이지를 다른 브라우저 탭에서 열어 두 애플리케이션 간에 쉽게 전환할 수 있습니다.

전제조건

Cloud Pak for Data as a Service에 등록하고 Data Governance and Privacy 사용 사례에 필요한 서비스를 프로비저닝해야 합니다.

다음 방법 중 하나로 Cloud Pak for Data as a Service에 등록할 수 있습니다.

필요한 서비스 프로비저닝

필요한 서비스를 확인하거나 프로비저닝하려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴에서 서비스 > 서비스 인스턴스를 선택하십시오.
  2. 제품 드롭 다운 상자를 사용하여 기존 Watson Knowledge Catalog 서비스 인스턴스가 있는지 판별하십시오.
  3. Watson Knowledge Catalog 서비스 인스턴스를 작성해야 하는 경우 서비스 추가를 클릭하십시오.
  4. Watson Knowledge Catalog를 선택하십시오.
  5. Lite 플랜을 선택하십시오.
  6. 작성을 클릭하십시오.

데이터 신뢰

비디오 시청 이 태스크를 미리 보려면 00:47에서 시작하는 비디오를 시청하십시오.

데이터 신뢰 학습서를 완료하여 데이터 자산을 가져오고 강화하여 카탈로그에 공개하십시오.

1단계: 데이터 보호 규칙을 작성하여 액세스 거부

비디오 시청 이 태스크를 미리 보려면 02:23에서 시작하는 비디오를 시청하십시오

데이터 보호 규칙은 데이터 자산에 대한 액세스를 제어합니다. 다음 단계를 수행하여 일부 모기지 데이터 자산의 기밀 정보에 대한 액세스를 거부하는 데이터 보호 규칙을 작성하십시오.

  1. Cloud Pak for Data 탐색 메뉴에서 카탈로그 > 모든 카탈로그 보기를 선택하십시오.
  2. 모기지 승인 카탈로그를 여십시오.
  3. CREDIT_SCORE 데이터 자산을 클릭하십시오. 여기에는 기밀 태그가 포함되어 있습니다. 이 데이터 자산에 대한 액세스를 거부하는 규칙을 작성합니다.
  4. Cloud Pak for Data 탐색 메뉴에서 거버넌스 > 규칙을 선택하십시오.
  5. 규칙 추가 > 새 규칙을 클릭하십시오.
  6. 데이터 보호 규칙을 선택하십시오.
  7. 다음을 클릭하십시오.
  8. 규칙 이름에 Confidential Information을(를) 입력하십시오.
  9. 비즈니스 정의의 경우, Rule to prevent unauthorized users from accessing data assets that have been tagged as confidential. 입력
  10. 조건 1의 경우 다음 옵션을 선택하십시오.
    • 태그
    • contains any
    • 기밀
  11. 조치의 경우 데이터에 대한 액세스 거부를 선택하십시오.
  12. 작성을 클릭하십시오. 이 규칙은 이제 "기밀"로 태그 지정된 데이터 자산에 액세스하려는 모든 사용자의 데이터에 대한 액세스를 거부합니다. 이 규칙은 카탈로그 미리보기, 카탈로그 다운로드, Data Refinery 및 프로젝트 자산 미리보기에 적용됩니다. 규칙을 작성한 개인이나 프로젝트에 자산을 추가한 사람에게는 규칙이 적용되지 않습니다. 다른 사용자가 CREDIT_SCORE 데이터 자산에 액세스하려고 하는 것을 보게 되는 것을 확인하기 위해 XX:XX에서 비디오를 시청하십시오.

2단계: 데이터를 마스크할 데이터 보호 규칙 작성

비디오 시청 이 태스크를 미리 보려면 02:23에서 시작하는 비디오를 시청하십시오

다음 단계를 수행하여 미국 사회 보장 번호가 있는 열을 포함하는 데이터 자산을 마스크할 데이터 보호 규칙을 작성하십시오.

  1. 모기지 승인 카탈로그에서 MORTGAGE_APPLICANTS 데이터 자산을 클릭하십시오.
  2. 데이터를 미리보려면 자산 탭을 클릭하십시오. 열 중 하나에는 사회 보장 번호가 들어 있습니다. 이 열을 마스크하는 규칙을 작성합니다.
  3. Cloud Pak for Data 탐색 메뉴에서 거버넌스 > 규칙을 선택하십시오.
  4. 규칙 추가 > 새 규칙을 클릭하십시오.
  5. 데이터 프로젝션 규칙을 선택하십시오.
  6. 다음을 클릭하십시오.
  7. 규칙 이름에 Redact Social Security Number을(를) 입력하십시오.
  8. 비즈니스 정의의 경우, Rule to redact Social Security Number. 입력
  9. 조건 1의 경우 다음 옵션을 선택하십시오.
    • 비즈니스 용어
    • contains any
    • 사회보장번호
  10. 조치의 경우 마스크 데이터를 선택하십시오. 비즈니스 용어사회 보장 번호가 채워집니다.
  11. 마스킹 옵션에 대해 개정을 선택하십시오. 이렇게 하면 데이터가 X로 바뀝니다. 각 마스킹 옵션 위로 마우스를 이동하면 선택한 옵션을 사용하여 마스크된 예 데이터를 볼 수 있습니다.
  12. 작성을 클릭하십시오. 이 규칙은 데이터 자산의 미국 사회 보장 번호와 함께 열을 개정합니다. 다른 사용자가 MORTGAGE_APPLICANTS 데이터 자산에 액세스하는 것을 보게 되는 것을 확인하기 위해 XX:XX에서 비디오를 시청하십시오.

3단계: 고급 마스킹을 사용하여 데이터 보호 규칙 작성

비디오 시청 이 태스크를 미리 보려면 02:23에서 시작하는 비디오를 시청하십시오

다음 단계를 수행하여 이메일 주소가 있는 열을 포함하는 데이터 자산을 마스크할 데이터 보호 규칙을 작성하십시오.

  1. Cloud Pak for Data 탐색 메뉴에서 카탈로그 > 모든 카탈로그 보기를 선택하십시오.
  2. 모기지 승인 카탈로그를 여십시오.
  3. MORTGAGE_APPLICANTS 데이터 자산을 클릭하십시오. 열 중 하나에 이메일 주소가 포함되어 있음에 유의하십시오. 고급 마스킹을 사용하여 이 열을 마스크하는 규칙을 작성합니다.
  4. Cloud Pak for Data 탐색 메뉴에서 거버넌스 > 규칙을 선택하십시오.
  5. 규칙 추가 > 새 규칙을 클릭하십시오.
  6. 데이터 프로젝션 규칙을 선택하십시오.
  7. 다음을 클릭하십시오.
  8. 규칙 이름에 Obfuscate email address을(를) 입력하십시오.
  9. 비즈니스 정의의 경우, Rule to obfuscate the email address using advanced masking options. 입력
  10. 조건 1의 경우 다음 옵션을 선택하십시오.
    • 데이터 클래스
    • contains any
    • 이메일 주소
  11. 조치의 경우 마스크 데이터를 선택하십시오.
  12. in columns containing 필드의 경우 데이터 클래스를 선택하십시오. 이메일 주소가 사용자를 위해 채워집니다.
  13. 마스킹 옵션에 대해 난독화를 선택하십시오.
  14. 고급 마스킹 옵션 사용을 선택하십시오.
  15. 옵션을 변경할 때마다 미리보기를 새로 고치려면 자동 새로 고침 미리보기를 선택하십시오.
  16. 난독화 방법의 경우 형식 보존을 선택하십시오. 보존 형식 메소드를 사용하여 사용자 이름을 생성하거나 사용자 이름의 접두부 및 번호를 제공할 수 있습니다.
    1. 접두부 더하기 숫자를 선택하고 mail을(를) 입력하여 미리보기를 확인하십시오.
    2. 이 시나리오에서는 사용자 이름 생성을 선택하는 것이 좋습니다.
  17. 도메인 이름 옵션에는 다음 세 가지 옵션이 포함됩니다.
    1. 이메일 주소가 표시되는 방식을 미리보려면 공통 이메일 서비스를 선택하십시오.
    2. 이메일 주소가 표시되는 방식을 미리보려면 사용자 정의를 선택하십시오.
    3. 이 시나리오에서는 오리지널을 선택하는 것이 좋습니다.
  18. 가역성의 경우, 유일한 옵션은 영구적인 비가역적 마스킹입니다. 기타 데이터 유형의 경우 암호화 키를 사용하여 원래 값을 복구할 수 있는 가역적인 마스킹을 선택하는 옵션이 있을 수 있습니다.
  19. 일관성의 경우 반복 가능을 선택하십시오. 반복 가능한 옵션은 마스킹이 참조 무결성을 사용하여 수행될 수 있도록 하며, 이는 이메일 주소가 smith.lee가 될 때마다 shoshana.vitrano로 대체될 것임을 의미합니다.
  20. 입력 유효성 검증의 경우 입력 유효성 검증의 기본값을 유지하십시오. 입력 유효성 검증 옵션은 잘못된 값이 있는지 확인하고 올바르게 형식화되지 않은 값이 있는 행을 제거합니다.
  21. 작성을 클릭하십시오. 이 규칙을 적용하면 데이터 사용자가 카탈로그에서 데이터를 동적으로 미리볼 때 또는 마스킹 플로우를 통해 데이터 사본을 정적으로 추출할 때 데이터 사용자를 위해 데이터 사용자가 데이터를 보호합니다. 다른 사용자가 MORTGAGE_APPLICANTS 데이터 자산에 액세스하는 것을 보게 되는 것을 확인하기 위해 XX:XX에서 비디오를 시청하십시오.

단계 4: 마스킹 플로우 작성

비디오 시청 이 태스크를 미리 보려면 02:23에서 시작하는 비디오를 시청하십시오

마스킹 플로우 규정을 사용하여 카탈로그에서 다른 대상 데이터베이스로 마스크된 사본 또는 마스크된 데이터 서브세트를 보냅니다. 작성된 사본은 이전에 관리자 설정된 데이터 보호 규칙을 사용하여 고급 마스킹 옵션을 사용하여 식별되지 않습니다. 마스킹 플로우를 작성하고 실행하려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴에서 카탈로그 > 모든 카탈로그 보기를 선택하십시오.
  2. 모기지 승인 카탈로그를 클릭하십시오.
  3. 카탈로그에서 MORTGAGE_APPLICANTS 데이터 자산을 선택하십시오.
  4. 프로젝트에 추가를 클릭하십시오.
    1. 대상의 경우, Data Governance and Privacy 프로젝트를 선택하십시오.
    2. 추가를 클릭하십시오.
  5. Cloud Pak for Data 탐색 메뉴에서 프로젝트 > 모든 프로젝트 보기를 선택하십시오.
  6. Data Governance and Privacy 프로젝트를 클릭하십시오.
  7. 자산 탭을 클릭하십시오.
  8. 새 자산을 클릭하십시오.
  9. 데이터 개인정보 보호를 선택하십시오.
  10. 이름의 경우 Applicants in California을(를) 입력하십시오.
  11. 설명의 경우 Creates masked copy of applicants and related recrods for applicants in California을(를) 입력하십시오.
  12. 다음을 클릭하십시오.
  13. 두 가지 마스킹 유형이 있습니다. 하나 이상의 테이블 복사는 관계를 검색하지 않고 테이블의 마스크된 cop8ies를 생성합니다. 드라이버 테이블 및 관련 데이터 복사를 사용하면 기본 키 및 외부 키 관계를 포함하는 데이터의 서브세트를 작성하고 관련 서브세트를 가질 수 있습니다. 이 시나리오에서 하나 이상의 테이블 복사를 선택하십시오.
  14. 프로젝트에서 데이터 추가를 클릭하십시오.
    1. 데이터 패브릭 평가판- Db2 Warehouse 연결을 선택하십시오.
    2. AI_MORTGAGE 스키마를 선택하십시오.
    3. MORTGAGE_APPLICANTS 테이블을 선택하십시오.
    4. 선택을 클릭하십시오. 이 자산은 마스크된 열을 포함하는 것으로 인식됩니다.
  15. 정의를 클릭하십시오.
    1. 상태 열 옆에서 +(더하기 부호)를 클릭하십시오.
    2. 값에 California을(를) 입력하십시오.
    3. 해당 값을 저장하려면 저장을 클릭하십시오.
    4. 저장을 다시 클릭하여 마스킹 플로우 작성 페이지로 돌아가십시오.
  16. 작업 작성을 클릭하십시오.
    1. 이름의 경우 Applicants in California을(를) 입력하십시오.
    2. 다음을 클릭하십시오.
    3. 대상 연결의 경우, 데이터 패브릭 평가판- Db2 Warehouse 연결을 선택하십시오.
    4. 대상 스키마의 경우 BANKING을 선택하십시오.
    5. 파티션을 계속하려면 다음을 클릭하십시오.
  17. 스케줄을 계속하려면 다음을 클릭하십시오.
  18. 검토를 계속하려면 다음을 클릭하십시오.
  19. 작업 작성 및 실행을 클릭하십시오.
  20. 작업 실행이 완료되면 결과를 보기 위해 대상 데이터베이스를 탐색할 수 있습니다. XX:XX의 비디오를 시청하고 Db2 Warehouse 인스턴스에서 테이블의 모양을 확인하십시오.

다음 단계

이제 데이터 패브릭에서 데이터를 평가, 공유, 구체화 및 분석하여 데이터를 알 준비가 되었습니다.데이터 알기 학습서를 참조하십시오.

자세히 보기

상위 주제: 데이터 패브릭 학습서