데이터 거버넌스 튜토리얼: 가상화된 데이터 거버넌스
이 이 학습서는 데이터 패브릭 평가판의 데이터 통합 유스 케이스를 사용하여 고품질 데이터 큐레이트 튜토리얼, 데이터 보호 튜토리얼및 외부 데이터 가상화 튜토리얼 을 완료한 후 가상화된 데이터를 통제합니다. 사용자의 목표는 모기지 신청자 및 애플리케이션과 권한이 없는 액세스에 대한 해당 신용 점수를 포함하는 가상 데이터를 보호하는 것입니다. 모든 골든 은행 직원이 해당 개인 정보에 액세스할 수 없도록 주민등록번호와 같은 특정 개인 정보를 마스크해야 합니다.
이 튜토리얼의 내용은 Golden Bank에 세 개의 외부 데이터 소스에 저장된 고품질 고객 모기지 데이터에 액세스해야 하는 여러 부서가 있다는 점입니다. 통제 팀의 데이터 스튜워드로서, 가상화된 데이터를 강화하고 가상화된 데이터가 보호되는지 확인해야 합니다.
다음 애니메이션 이미지는 이 학습서의 끝에서 수행할 작업에 대한 빠른 미리보기를 제공합니다. 프로젝트에 가상 데이터를 추가한 후 비즈니스 용어로 해당 데이터를 강화하고 IBM Knowledge Catalog 데이터 보호 규칙이 Cloud Pak for Data as a Service를 통해 데이터를 마스크하는 방법을 확인합니다. 더 큰 이미지를 보려면 이미지를 클릭하십시오.
튜토리얼 미리보기
이 학습서에서는 다음 태스크를 완료합니다.
- 전제조건을 설정하십시오.
- 태스크 1: 가상화된 데이터의 통제를 사용으로 설정합니다.
- 태스크 2: 가상 테이블에서 SQL 조회 실행
- 태스크 3: 가상화된 데이터를 프로젝트에 복사하십시오.
- 태스크 4: 가상화된 데이터 강화.
- 태스크 5: 메타데이터 강화 결과를 봅니다.
- 태스크 6: 카탈로그에 가상 테이블 공개
- 정리
비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.
이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.
이 학습을 완료하기 위한 팁
다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.
비디오 사진 사용
다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.
커뮤니티에서 도움 받기
이 튜토리얼에 대한 도움이 필요한 경우 Cloud Pak for Data 커뮤니티 토론 포럼에서 질문하거나 응답을 찾을 수 있습니다.
브라우저 창 설정
이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.
전제조건 설정
전제조건 학습서 완료
이 태스크를 미리 보려면 00:27에서 시작하는 비디오를 보십시오.
다음 학습서를 완료하십시오.
- 외부 데이터 가상화 학습서는 가상 테이블을 작성하고 세 개의 외부 소스에 저장된 데이터에서 보기를 결합합니다.
- 고품질 데이터 작성 학습서는 데이터 자산을 가져오고 강화하며 카탈로그에 공개합니다.
- 데이터를 보호하기 위한 데이터 보호 규칙을 작성하기 위한 데이터 보호 튜토리얼입니다.
태스크 1: 가상화된 데이터의 통제 사용
가상화된 데이터의 거버넌스를 가능하게 하기 위한 두 가지 필수 단계가 있습니다.
- Watson Query에서 데이터 보호 규칙을 적용합니다.
- IBM Knowledge Catalog 와 Watson Query간에 권한을 설정하십시오.
데이터 보호 규칙 적용
이 태스크를 미리 보려면 01:02에서 시작하는 비디오를 보십시오.
Watson Query에서 데이터 보호 규칙을 적용하려면 다음 단계를 수행하십시오.
탐색 데이터 > Data virtualization 선택합니다.
통제를 적용하도록 기본 카탈로그 설정에 대한 알림이 표시되면 통제로 이동을 클릭하십시오. 이 메시지가 표시되지 않으면 서비스 메뉴에서 관리 > 서비스 설정을 클릭한 후 통제 탭을 클릭하십시오.
가상 오브젝트에 대한 데이터 보호 규칙 적용 옵션을 사용으로 설정하고 저장을 클릭하십시오.
서비스 메뉴에서 가상화 > 데이터 소스로 돌아가십시오.
진행 상태 확인
다음 이미지는 정책 적용이 사용으로 설정된 통제 탭을 표시합니다. 그런 다음 IBM Knowledge Catalog 와 Data Virtualization간에 권한을 설정해야 합니다.
진행 상태 확인
다음 이미지는 IBM Knowledge Catalog 와 Data Virtualization간의 권한이 있는 IBM Cloud 의 권한 부여 페이지를 표시합니다. 이제 Data Virtualization에서 통제된 가상 테이블을 조회할 준비가 되었습니다.
태스크 2: 통제된 가상 테이블에서 SQL 조회 실행
이 태스크를 미리보려면 02:20에 시작하는 비디오를 보십시오.
데이터 보호 규칙이 있는 경우 가상 테이블은 해당 규칙에 의해 제어됩니다. 통제된 가상 테이블에서 SQL 조회를 실행하려면 다음 단계를 수행하십시오.
Watson Query 서비스 메뉴에서 SQL 실행을 클릭하십시오.
새 조회에 대해 다음 SELECT문을 복사하여 붙여넣으십시오.
<your schema>
를 이전에 기록한 스키마 이름으로 바꾸십시오.SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
조회는 SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
모두 실행을 클릭하십시오.
조회가 완료되면 히스토리 탭에서 조회를 선택하십시오. 결과 탭에서 테이블이 캘리포니아 주의 신청자에 대해서만 필터링되는 것을 볼 수 있습니다. 데이터 보호 규칙은 Watson Query, 카탈로그 미리보기, 카탈로그 다운로드, Data Refinery및 프로젝트 자산 미리보기에 적용됩니다. 규칙은 자산 소유자에게 적용되지 않습니다. 02:47 에서 비디오를 보고 다른 사용자가 SQL 조회를 실행할 때 표시되는 내용을 확인하십시오.
진행 상태 확인
다음 이미지는 다른 사용자의 관점에서 SQL 조회 결과를 표시합니다. 이제 가상 테이블을 프로젝트에 복사할 준비가 되었습니다.
태스크 3: 프로젝트에 가상 데이터 복사
이 태스크를 미리 보려면 03:02에서 시작하는 비디오를 보십시오.
외부 데이터 가상화 학습서에서 가상 테이블 및 가상 결합 보기를 작성하고 이를 데이터 통합 프로젝트에 복사했습니다. 해당 프로젝트를 사용하여 이 학습서를 완료하려면 태스크 3으로 건너뛰십시오. 데이터 관리 프로젝트를 사용하여 이 학습서를 완료하려면 다음 단계를 수행하십시오.
서비스 메뉴에서 가상화 > 가상화된 데이터를 클릭하십시오.
다음 테이블을 선택하십시오.
- MORTGAGE_APPLICATION
- 모기지 신청자
- CREDIT_SCORE
- 결합된 애플리케이션
- 결합된 애플리케이션 애플리케이션 크레딧 점수
지정을 클릭하십시오.
프로젝트에 대해 데이터 거버넌스를 선택하십시오.
지정을 클릭하십시오.
가상 오브젝트가 지정되면 프로젝트로 이동하십시오.
데이터 거버넌스 프로젝트에서 자산 탭을 클릭하십시오. 가상 데이터 테이블은
<your schema>
로 시작합니다.가상 데이터 테이블을 여십시오. 예를 들어, APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED 가상 테이블을 클릭하여 이를 보십시오.
데이터 자산에 액세스하기 위한 신임 정보를 제공하십시오.
인증 방법으로 API키를 선택하십시오.
외부 데이터 가상화 학습서에서 작성한 것과 동일한 API키를 붙여넣으십시오.
연결을 클릭하십시오. 데이터 보호 규칙은 카탈로그 미리보기, 카탈로그 다운로드, Data Refinery및 프로젝트 자산 미리보기에 적용됩니다. 규칙은 자산 소유자에게 적용되지 않습니다. 04:09 의 비디오를 보고 다른 사용자가 가상 데이터 테이블에 액세스하려고 시도하는 것을 확인하십시오.
진행 상태 확인
다음 이미지는 다른 사용자의 관점에서 프로젝트에 마스크된 열이 있는 가상 테이블을 표시합니다. 이제 데이터를 강화할 준비가 되었습니다.
태스크 4: 가상 데이터 테이블 강화
이 태스크를 미리보려면 04:21에서 시작하는 비디오를 보십시오.
사용자가 데이터를 더 빠르게 찾을 수 있도록 정보를 사용하여 데이터 자산을 강화할 수 있습니다. 사용자는 인리치먼트를 사용하여 데이터가 현재 태스크에 적합한지 여부, 데이터를 신뢰할 수 있는지 여부 및 데이터에 대한 작업 방법을 결정할 수 있습니다. 이러한 정보에는 데이터의 의미를 정의하는 용어, 소유권을 문서화하거나 품질 표준을 판별하는 규칙 또는 검토 등이 포함됩니다. 가상 데이터 테이블을 강화하려면 다음 단계를 수행하십시오.
탐색 추적에서 데이터 통제 를 클릭하여 프로젝트로 돌아가십시오.
에 자산 탭, 클릭 새 자산 > 메타데이터로 데이터 자산 강화 .
이름에 대해 다음 텍스트를 복사하여 붙여넣으십시오.
Virtual mortgage data - metadata enrichment
계속하려면 다음을 클릭하십시오.
프로젝트에서 데이터 선택을 클릭하십시오.
데이터 자산을 선택하십시오.
다음 자산 옆에 있는 선택란을 클릭하십시오.
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
선택을 클릭하십시오.
강화 목표를 계속하려면 다음을 클릭하십시오.
모든 강화 목표를 선택하십시오.
- 프로파일 데이터
- 용어 지정
- 기본 품질 분석 실행
카테고리의 경우 카테고리 선택을 클릭하십시오.
[범주화되지 않음] 및 Banking만 선택하십시오.
선택을 클릭하십시오.
샘플링의 경우 기본을 선택하십시오.
스케줄을 계속하려면 다음을 클릭하십시오.
검토를 계속하려면 다음을 클릭하십시오.
작성을 클릭하십시오.
메타데이터 강화 자산이 표시되지만 작업을 완료하는 데 몇 분이 걸릴 수 있습니다. 새로 고치기 아이콘 을 클릭하여 대기됨 에서 진행 중 에서 완료됨으로의 상태 변경을 감시하십시오. 작업 실행이 완료되면 5개의 자산이 나열됩니다.
진행 상태 확인
다음 이미지는 완료된 메타데이터 강화를 표시합니다. 이제 강화된 데이터 자산을 탐색할 수 있습니다.
태스크 5: 메타데이터 강화 결과 보기
이 태스크를 미리보려면 05:48에서 시작하는 비디오를 보십시오.
메타데이터 강화 실행이 완료되면 다음 단계에 따라 강화된 데이터를 보십시오.
가상 모기지 데이터-메타데이터 강화 화면에서 열 탭을 클릭하십시오.
mortgage_applicant
을(를) 검색하십시오.열목록에서 your-schema.MORTGAGE_APPLICANT 자산에 대한 EMAIL_ADDRESS 열을 찾으십시오.
your_schema.MORTGAGE_APPLICANT 행의 EMAIL_ADDRESS 끝에 있는 오버플로우 메뉴 를 클릭하고 열 세부사항 보기를 선택하십시오.
세부사항 탭의 측면 패널에 형식, 도수 분포, 통계와 같은 프로파일링 정보가 표시됩니다.
측면 패널에서 통제 탭을 클릭하십시오. 이 탭에는 메타데이터 강화 중에 자동 지정된 데이터 클래스 및 비즈니스 용어가 포함되어 있습니다. 제안된 비즈니스 용어 및 데이터 클래스를 보고 수동으로 지정할 수도 있습니다.
제안된 비즈니스 용어 또는 데이터 클래스를 검토하고 수동으로 지정하십시오. 예를 들어, 제안된 비즈니스 용어로 주소 를 볼 수 있습니다.
제안된 비즈니스 용어를 클릭하십시오.
주소에 대해 지정을 클릭하십시오.
제안된 데이터 클래스를 클릭하십시오.
텍스트에 대해 지정을 클릭하십시오.
your_schema.MORTGAGE_APPLICANT 자산 행에 대한 EMAIL_ADDRESS 열의 끝에서 오버플로우 메뉴 를 클릭하고 데이터 품질 세부사항 보기를 선택하십시오.
데이터 품질 점수를 봅니다. IBM Knowledge Catalog 는 사전 빌드된 차원에 따라 모든 레코드의 모든 값을 분석하여 각 열 및 데이터 자산에 대한 데이터 품질 점수를 자동으로 생성합니다.
X 를 클릭하여 데이터 품질 창을 닫으십시오.
credit_score
을(를) 검색하십시오.your_schema.CREDIT_SCORE 자산에 대한 CITY 컬럼의 경우, 오버플로우 메뉴 를 누르고 검토됨으로 표시를 선택하십시오.
자산 탭을 클릭하십시오.
자산목록에서 your_schema.MORTGAGE_APPLICANT 자산에 대해 오버플로우 메뉴 를 클릭하고 자산 세부사항 보기를 선택하십시오.
측면 패널에서 통제 탭을 클릭하여 자동 지정된 비즈니스 용어를 확인하십시오.
추가 아이콘 을 클릭하여 (또는 편집 아이콘 이 표시될 수 있음) 비즈니스 용어를 수동으로 지정하십시오.
social
을(를) 검색하십시오. 결과가 표시되지 않으면 드롭 다운 목록이 제안된 용어대신 모든 용어 로 설정되어 있는지 확인하십시오.주민등록번호를 선택하십시오.
지정을 클릭하십시오.
진행 상태 확인
다음 이미지는 검토되고 강화된 데이터 자산을 표시합니다. 다음 단계는 강화된 데이터를 카탈로그에 공개하여 조직과 공유하는 것입니다.
태스크 6: 카탈로그에 가상 테이블 공개
이 태스크를 미리 보려면 7:18에서 시작하는 비디오를 보십시오.
이제 가상화된 데이터가 비즈니스 용어로 강화되었으므로 다음 단계에 따라 가상 테이블을 카탈로그에 공개하십시오.
탐색 추적에서 데이터 통제 를 클릭하여 프로젝트로 돌아가십시오.
자산 탭을 클릭하십시오.
데이터 > 데이터 자산으로 이동하십시오.
다음 자산 옆에 있는 선택란을 클릭하십시오.
<your schema>.MORTGAGE_APPLICATION
<your schema>.MORTGAGE_APPLICANT
<your schema>.CREDIT_SCORE
<your schema>.APPLICANTS_APPLICATIONS_JOINED
<your schema>.APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED
카탈로그에 공개를 클릭하십시오.
목록에서 모기지 승인 카탈로그 (또는 사용자의 카탈로그 이름) 를 선택하고 다음을 클릭하십시오.
공개 후 카탈로그로 이동옵션을 선택하고 다음을 클릭하십시오.
자산을 검토하고 공개를 클릭하십시오.
모기지 승인 카탈로그에서
<your-schema>
를 검색하십시오.가상 테이블 중 하나를 여십시오. 프롬프트가 표시되면 신임 정보를 제공하십시오.
인증 방법으로 API키를 선택하십시오.
외부 데이터 가상화 학습서에서 작성한 것과 동일한 API키를 붙여넣으십시오.
데이터를 보려면 자산 탭을 클릭하십시오. 데이터 보호 규칙은 카탈로그 미리보기, 카탈로그 다운로드, Data Refinery및 프로젝트 자산 미리보기에 적용됩니다. 규칙은 자산 소유자에게 적용되지 않습니다. 08:17 에서 비디오를 보고 카탈로그의 가상 데이터 테이블에 액세스하려고 시도하는 다른 사용자에게 표시되는 내용을 확인하십시오.
진행 상태 확인
다음 이미지는 사용자의 관점에서 카탈로그에 있는 가상 테이블의 데이터 미리보기를 표시합니다.
Golden Bank의 데이터 엔지니어 및 데이터 스튜워드로서, 가상화된 데이터가 보호되도록 가상화된 데이터를 강화했습니다.
정리 (선택사항)
데이터 관리 유스 케이스에서 학습서를 다시 가져오려면 각 전제조건 학습서의 정리 섹션을 참조하십시오.
다음 단계
다음 학습서를 사용해 보십시오.
다른 데이터 패브릭 유스 케이스에 등록하십시오.
자세한 정보
상위 주제: 유스 케이스 학습서