0 / 0
영어 버전 문서로 돌아가기
데이터 관리 튜토리얼 파일 것됩습니다이합니다.

데이터 관리 튜토리얼 파일 것됩습니다이합니다.

데이터 패브릭 평가판의 데이터 거버넌스 유스 케이스를 사용하여 신뢰할 수 있는 데이터를 준비하는 방법을 학습하려면 이 학습서를 사용하십시오. 목표는 데이터를 강화하고 데이터 품질 분석을 실행하여 신뢰할 수 있는 데이터 자산을 작성하는 것입니다.

빠른 시작: 이 학습서의 샘플 프로젝트를 아직 작성하지 않은 경우 자원 허브에서 데이터 관리 샘플 프로젝트 에 액세스하십시오.

이 학습서의 내용은 골든 뱅크에는 고품질의 고객 모기지 데이터에 대한 액세스가 필요한 여러 부서가 있다는 점입니다. 통제 팀의 데이터 스튜워드는 데이터 이용자가 셀프 서비스 카탈로그에서 쉽게 찾을 수 있는 고품질의 보호된 데이터 자산을 제공하기 위해 회사의 데이터를 정렬하고 구성해야 합니다.

다음 애니메이션 이미지는 외부 데이터 소스에서 메타데이터를 가져오고, 자동 지정된 비즈니스 용어로 해당 데이터를 강화하고, 강화된 데이터를 보고, 강화된 데이터를 카탈로그에 공개하는 이 학습서 종료 시 수행할 작업에 대한 빠른 미리보기를 제공합니다. 더 큰 이미지를 보려면 이미지를 클릭하십시오.

애니메이션 이미지

튜토리얼 미리보기

이 학습서에서는 다음 태스크를 완료합니다.

비디오 시청 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.





이 학습을 완료하기 위한 팁

비디오 사진 사용

팁: 비디오를 시작한 후 학습을 통해 화면이동하면 비디오가 그림 모드로 이동합니다. 사진에서 가장 좋은 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료하면서 비디오를 따라갈 수 있습니다. 각 태스크에 대한 시간소인을 클릭하여 수행하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장 사용 방법

커뮤니티에서 도움 받기

이 튜토리얼에 대한 도움이 필요한 경우 Cloud Pak for Data 커뮤니티 토론 포럼에서 질문하거나 응답을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.



전제조건 설정

Cloud Pak for Data as a Service 가입

Cloud Pak for Data as a Service 에 등록하고 데이터 통합 유스 케이스에 필요한 서비스를 프로비저닝해야 합니다.

  • 기존 Cloud Pak for Data as a Service 계정이 있는 경우 이 튜토리얼을 시작할 수 있습니다. Lite 플랜 계정이 있는 경우에는 계정당 한 명의 사용자만 이 학습서를 실행할 수 있습니다.
  • Cloud Pak for Data as a Service 계정이 아직 없는 경우에는 데이터 패브릭 평가판에 등록하십시오.

비디오 아이콘 다음 비디오를 보고 Cloud Pak for Data의 데이터 패브릭에 대해 알아보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

필요한 프로비저닝된 서비스 확인

학습서 비디오 미리보기 이 태스크를 미리보려면 01:05에서 시작하는 비디오를 보십시오.

필요한 서비스를 확인하거나 프로비저닝하려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 서비스 > 서비스 인스턴스를 선택하십시오.

  2. 제품 드롭 다운 목록을 사용하여 IBM Knowledge Catalog 서비스 인스턴스가 있는지 여부를 판별하십시오.

  3. IBM Knowledge Catalog 서비스 인스턴스를 작성해야 하는 경우 서비스 추가를 클릭하십시오.

    1. IBM Knowledge Catalog를 선택하십시오.

    2. Lite 플랜을 선택하십시오.

    3. 작성을 클릭하십시오.

  4. 이 단계를 반복하여 Cloud Object Storage 서비스를 확인하거나 프로비저닝하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 프로비저닝된 서비스 인스턴스를 표시합니다.

프로비저닝된 서비스

샘플 프로젝트 작성

학습서 비디오 미리보기 이 태스크를 미리보려면 01:38에서 시작하는 비디오를 보십시오.

이 학습서의 샘플 프로젝트를 아직 작성하지 않은 경우 다음 단계를 수행하십시오.

  1. 자원 허브에서 데이터 관리 샘플 프로젝트 에 액세스하십시오.

  2. 프로젝트 작성을 클릭하십시오.

  3. 프로젝트를 Cloud Object Storage 인스턴스에 연관시키도록 프롬프트가 표시되면 목록에서 Cloud Object Storage 인스턴스를 선택하십시오.

  4. 작성을 클릭하십시오.

  5. 프로젝트 가져오기가 완료될 때까지 기다린 후 새 프로젝트 보기 를 클릭하여 프로젝트 및 자산이 성공적으로 작성되었는지 확인하십시오.

  6. 자산 탭을 클릭하여 프로젝트의 자산을 보십시오.

  7. Banking.csv 데이터 자산 행의 끝에 있는 오버플로우 메뉴 오버플로우 메뉴에서 다운로드를 선택하고 컴퓨터에 저장하십시오. 나중 단계에서 이 파일을 사용할 것이다.

참고: 이 유스 케이스에 포함된 학습서를 보여주는 둘러관련 프로그램을 볼 수 있습니다. 안내식 둘러보기의 링크는 이 학습서 지시사항을 엽니다.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 샘플 프로젝트의 자산 탭을 표시합니다. 이제 학습서를 시작할 준비가 되었습니다.

샘플 프로젝트




태스크 1: 카탈로그 작성

학습서 비디오 미리보기 이 태스크를 미리보려면 02:49에 시작하는 비디오를 보십시오.

데이터에 대한 작업을 시작하기 전에 조직과 공유할 데이터를 공개할 카탈로그를 작성하십시오. IBM Knowledge Catalog Lite 플랜을 사용하면 두 개의 카탈로그만 작성할 수 있습니다. 이미 카탈로그가 있는 경우 이 단계를 건너뛸 수 있습니다. 그렇지 않으면 다음 단계에 따라 카탈로그를 작성하십시오.

팁: 이번이 처음으로 카탈로그에 액세스하는 경우 카탈로그를 둘러볼 것인지 묻는 안내서가 표시됩니다. 지금은 나중에를 클릭하십시오.
  1. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 카탈로그 > 모든 카탈로그 보기를 선택하십시오.

  2. 카탈로그 페이지에 카탈로그가 표시되면 태스크 2: 카테고리 작성으로 건너뛰십시오. 그렇지 않으면 다음 단계를 수행하여 새 카탈로그를 작성하십시오.

  3. 카탈로그 작성을 클릭하십시오.

  4. 이름의 경우, 앞이나 뒤에 공백 없이 표시된 대로 정확하게 카탈로그 이름을 복사하여 붙여넣으십시오.

    Mortgage Approval Catalog
    
  5. 데이터 보호 규칙 적용을 선택하고 선택사항을 확인한 후 다른 필드의 기본값을 승인하십시오.

  6. 작성을 클릭하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 카탈로그를 표시합니다. 이제 조직과 자산을 공유할 준비가 되었습니다.

모기지 승인 카탈로그




태스크 2: 카테고리 작성

학습서 비디오 미리보기 이 태스크를 미리 보려면 03:13에서 시작하는 비디오를 보십시오.

다음 태스크에서 가져올 비즈니스 용어를 포함하려면 카테고리가 필요합니다. 카테고리는 통제 아티팩트 및 해당 아티팩트를 작성하고 관리할 수 있는 사용자를 구성하는 폴더 역할을 합니다. 카테고리를 작성하려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 통제 > 카테고리를 선택하십시오.

  2. 카테고리 추가 > 새 카테고리를 클릭하십시오.

  3. 이름에 Banking을(를) 입력하십시오.

  4. 작성을 클릭하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 은행 카테고리를 표시합니다. 이제 비즈니스 용어를 가져올 준비가 되었습니다.

뱅킹 카테고리




태스크 3: 비즈니스 용어 추가

학습서 비디오 미리보기 이 태스크를 미리보려면 03:41에서 시작하는 비디오를 보십시오.

이제 비즈니스 용어를 새 카테고리로 가져오십시오. 이를 사용하여 이후 단계에서 데이터 자산을 강화합니다. 비즈니스 용어는 비즈니스 개념의 표준화된 정의이므로 엔터프라이즈 전체에서 데이터를 일관되고 쉽게 이해할 수 있는 방법으로 설명할 수 있습니다. 파일에서 비즈니스 용어를 가져오려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 통제 > 비즈니스 용어를 선택하십시오.

  2. 비즈니스 용어 추가 > 파일에서 가져오기를 클릭하십시오.

  3. 여기에 파일 끌어서 놓기 또는 업로드를 클릭하십시오.

    1. 이전에 다운로드한 banking.csv 파일을 선택하십시오.

    2. 열기를 누르십시오.

  4. 다음 을 클릭하십시오.

  5. 모든 값 바꾸기를 선택하고 다음을 클릭하십시오.

  6. 초안 비즈니스 용어를 보려면 태스크로 이동 을 클릭하십시오. 알림이 누락된 경우 Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 통제 > 태스크 받은 편지함을 선택하십시오.

  7. 비즈니스 용어 공개 선택란을 선택한 후 공개를 클릭하십시오. 공개 를 클릭하여 확인하십시오.

  8. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 통제 > 비즈니스 용어 를 선택하여 공개된 비즈니스 용어를 보십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 가져온 비즈니스 용어를 표시합니다. 이제 데이터를 프로젝트로 가져온 후 가져온 비즈니스 용어로 보강할 준비가 되었습니다.

가져온 비즈니스 용어




태스크 4: 프로젝트로 데이터 가져오기

학습서 비디오 미리보기 이 태스크를 미리 보려면 04:47에서 시작하는 비디오를 보십시오.

샘플 프로젝트에는 모기지 자산을 포함하는 Db2 Warehouse 인스턴스에 대한 연결이 포함되어 있습니다. 데이터 자산과 연관된 기술 메타데이터를 프로젝트 또는 카탈로그로 가져와서 이러한 자산을 인벤토리, 평가 및 카탈로그화할 수 있습니다. 기술 메타데이터는 데이터 오브젝트의 구조를 설명합니다. 데이터 자산을 가져오려면 다음 단계를 수행하십시오.

  1. Cloud Pak for Data 탐색 메뉴 탐색 메뉴에서 프로젝트 > 모든 프로젝트 보기를 선택하십시오.

  2. 데이터 거버넌스 프로젝트를 클릭하십시오.

  3. 자산 탭을 클릭하십시오.

  4. 새 자산을 클릭하십시오.

  5. 자산 유형으로 메타데이터 가져오기 를 선택하십시오.

  6. 이름에 대해 다음 텍스트를 복사하여 붙여넣으십시오.

    Mortgage data - metadata import
    
  7. 계속하려면 다음을 클릭하십시오.

  8. 대상 선택 페이지에서 이 프로젝트를 선택하고 다음 을 클릭하여 계속하십시오.

  9. 범위 선택 페이지에서 연결 선택을 클릭하십시오.

    1. 데이터 패브릭 평가판- Db2 Warehouse 연결을 선택하십시오.

    2. WKC_MORTGAGE 스키마 옆의 선택란을 선택한 후 WKC_MORTGAGE 스키마 이름을 클릭하십시오.

    3. 다음 테이블을 선택하십시오.

      • 상업 클라이언트
      • CREDIT_SCORE
      • HOUSE_PRICE
      • MORTGAGE_APPLICANTS
      • MORTGAGE_APPLICATION
    4. 측면 패널에서 자산 목록을 검토한 후 선택을 클릭하십시오.

  10. 스케줄을 계속하려면 다음을 클릭하십시오. 메타데이터 강화를 수동으로 실행할 수 있으므로 스케줄을 끄십시오.

  11. 다음 을 클릭하여 고급 옵션으로 계속 진행하십시오.

  12. 고급 옵션 페이지에서 기본값을 승인하고 다음 을 클릭하여 검토를 계속하십시오.

  13. 가져오기 요약을 검토하고 작성을 클릭하십시오. 메타데이터 가져오기 작업이 시작됩니다.

  14. 새로 고치기 새로 고치기 아이콘 아이콘을 클릭하여 에서 진행 중 에서 가져옴으로의 상태 변경을 감시하십시오. 작업 실행이 완료되면 5개의 자산이 나열됩니다.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 완료된 메타데이터 가져오기를 표시합니다. 다음 태스크는 가져온 비즈니스 용어를 사용하여 가져온 데이터 자산을 강화하는 것입니다.

Metadata import 자산




태스크 5: 가져온 데이터 강화

학습서 비디오 미리보기 이 태스크를 미리 보려면 06:07에서 시작하는 비디오를 보십시오.

사용자가 데이터를 더 빨리 찾을 수 있도록 정보를 사용하여 데이터 자산을 강화하여 데이터가 현재 태스크에 적합한지 여부, 데이터를 신뢰할 수 있는지 여부 및 데이터에 대한 작업 방법을 결정할 수 있습니다. 이러한 정보에는 데이터의 의미를 정의하는 용어, 소유권을 문서화하거나 품질 표준을 판별하는 규칙 또는 검토 등이 포함됩니다. 가져온 데이터를 강화하려면 다음 단계를 수행하십시오.

  1. 탐색 추적에서 데이터 거버넌스 프로젝트 이름을 클릭하십시오.
    탐색 추적

  2. 자산 탭에서 새 자산을 클릭하십시오.

  3. 자산 유형으로 메타데이터 강화 를 선택하십시오.

  4. 이름에 대해 다음 텍스트를 복사하여 붙여넣으십시오.

    Mortgage data - metadata enrichment
    
  5. 계속하려면 다음을 클릭하십시오.

  6. 프로젝트에서 데이터 선택을 클릭하십시오.

    1. Metadata import를 선택하십시오.

    2. 모기지 데이터-메타데이터 가져오기옆에 있는 선택란을 클릭하십시오. 이 자산에는 다음 자산이 포함됩니다.

      • COMMERICIAL_CLIENT
      • CREDIT_SCORE
      • HOUSE_PRICE
      • MORTGAGE_APPLICANTS
      • MORTGAGE_APPLICATION
    3. 선택을 클릭하십시오.

  7. 강화 목표를 계속하려면 다음을 클릭하십시오.

  8. 모든 강화 목표를 선택하십시오.

    • 프로파일 데이터
    • 품질 분석
    • 용어 지정
  9. 카테고리의 경우 카테고리 선택을 클릭하십시오.

    1. [범주화되지 않음]Banking만 선택하십시오.

    2. 선택을 클릭하십시오.

  10. 샘플링의 경우 기본을 선택하십시오.

  11. 스케줄을 계속하려면 다음을 클릭하십시오. 가져오기를 수동으로 실행할 수 있으므로 스케줄을 끈 상태로 유지하십시오.

  12. 검토를 계속하려면 다음을 클릭하십시오.

  13. 작성을 클릭하십시오.

  14. 메타데이터 강화 자산이 표시되지만 작업을 완료하는 데 몇 분이 걸릴 수 있습니다. 분석되지 않음 에서 진행 중 에서 완료됨으로 상태 변경을 감시하려면 새로 고치기 새로 고치기 아이콘 아이콘을 클릭하십시오. 작업 실행이 완료되면 5개의 자산이 나열됩니다.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 완료된 메타데이터 강화를 표시합니다. 이제 강화된 데이터 자산을 탐색할 수 있습니다.

메타데이터 강화 자산




태스크 6: 메타데이터 강화 결과 보기

학습서 비디오 미리보기 이 태스크를 미리 보려면 07:45에서 시작하는 비디오를 보십시오.

메타데이터 강화 실행이 완료되면 다음 단계에 따라 강화된 데이터를 보십시오.

  1. 모기지 데이터-메타데이터 강화 화면에서 탭을 클릭하십시오.

  2. 목록에서 대출 신청자 자산에 대한 EMAIL_ADDRESS 열을 찾으십시오.

    1. MORTGAGE_사항 행의 EMAIL_ADDRESS 끝에서 오버플로우 오버플로우 메뉴 메뉴를 클릭하고 열 세부사항 보기를 선택하십시오.

    2. 세부사항 탭의 측면 패널에 형식, 도수 분포, 통계와 같은 프로파일링 정보가 표시됩니다.

    3. 측면 패널에서 통제 탭을 클릭하십시오. 이 탭에는 메타데이터 강화 중에 자동 지정된 데이터 클래스 및 비즈니스 용어가 포함되어 있습니다. 제안된 비즈니스 용어 및 데이터 클래스를 보고 수동으로 지정할 수도 있습니다.

    4. 제안된 용어를 검토하고 수동으로 지정하십시오.

      1. 제안된 비즈니스 용어를 클릭하십시오.

      2. 주소에 대해 지정을 클릭하십시오.

  3. MORTGAGE_사항 자산 행의 EMAIL_ADDRESS 열 끝에서 오버플로우 메뉴 오버플로우 메뉴를 클릭하고 데이터 품질 세부사항 보기를 선택하십시오.

    1. 데이터 품질 정보를 보십시오. IBM Knowledge Catalog 는 사전 빌드된 차원에 따라 모든 레코드의 모든 값을 분석하여 각 열 및 데이터 자산에 대한 데이터 품질 점수를 자동으로 생성합니다.

    2. X 를 클릭하여 데이터 품질 창을 닫으십시오.

  4. CREDIT_SCORE 자산에 대한 CITY 컬럼의 경우, 오버플로우 오버플로우 메뉴 메뉴를 누르고 검토됨으로 표시를 선택하십시오.

  5. 자산 탭을 클릭하십시오.

  6. 자산목록에서 MORTGAGE_사항 자산에 대해 오버플로우 오버플로우 메뉴 메뉴를 클릭하고 자산 세부사항 보기를 선택하십시오.

    1. 측면 패널에서 통제 탭을 클릭하여 비즈니스 용어 자동 지정을 확인하십시오.

    2. 비즈니스 용어를 수동으로 지정하려면 편집 편집 아이콘 아이콘을 클릭하십시오.

    3. social을(를) 검색하십시오. 결과가 표시되지 않으면 드롭 다운 목록이 제안된 용어대신 모든 용어 로 설정되어 있는지 확인하십시오.

    4. 주민등록번호를 선택하십시오.

    5. 지정을 클릭하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 검토되고 강화된 데이터 자산을 표시합니다. 다음 단계는 강화된 데이터를 카탈로그에 공개하여 조직과 공유하는 것입니다.

검토된 강화된 데이터 자산




태스크 7: 카탈로그에 데이터 공개

학습서 비디오 미리보기 이 태스크를 미리 보려면 09:06에 시작하는 비디오를 보십시오.

이제 강화된 데이터가 있으므로 데이터 과학자 및 데이터 분석가가 강화된 데이터 자산을 사용할 수 있도록 해당 데이터 자산을 카탈로그에 공개하려고 합니다. 다른 사용자가 신뢰할 수 있는 데이터에 액세스할 수 있도록 카탈로그에 강화된 데이터 자산을 저장하려면 다음 단계를 수행하십시오.

  1. 탐색 추적에서 데이터 거버넌스 프로젝트 이름을 클릭하십시오.

  2. 자산 탭을 클릭하십시오.

  3. 데이터 > 데이터 자산을 선택하십시오.

  4. 목록에서 COMMERICIAL_CLIENT, HOUSE_PRICE, 대출 신청자MORTGAGE_APPLICATION 데이터 자원을 선택하고 카탈로그에 공개를 누르십시오.

    1. 대상 카탈로그의 경우 모기지 승인 카탈로그를 선택하고 다음을 클릭하십시오.

    2. 태그에 대해 trusted태그를 입력하고 + (더하기 부호) 를 클릭한 후 다음을 클릭하십시오.

    3. 자산을 검토하고 공개를 클릭하십시오.

  5. 선택된 모든 자산을 지우고 목록에서 CREDIT_SCORE 자산 옆에 있는 선택란을 선택한 후 카탈로그에 발행을 누르십시오.

    1. 대상 카탈로그의 경우 모기지 승인 카탈로그를 선택하고 다음을 클릭하십시오.

    2. 태그에 대해 confidential태그를 입력하고 + (더하기 부호) 를 클릭하십시오.

    3. trusted태그를 입력하고 두 번째 태그에 대해 + (더하기 부호) 를 클릭하십시오.

    4. 공개 후 카탈로그로 이동옵션을 선택하고 다음을 클릭하십시오.

    5. 자산을 검토하고 공개를 클릭하십시오.

  6. 모기지 승인 카탈로그에서 자산을 필터링하십시오.

    1. 필터 필터 아이콘 아이콘을 클릭하십시오.

    2. 태그 섹션을 펼치십시오.

    3. 신뢰를 선택하고 적용을 클릭하십시오.

    4. 5개의 데이터 자원이 카탈로그에 추가되었는지 확인하십시오.

  7. MORTGAGE_사항 데이터 자산의 이름을 변경하십시오.

    1. MORTGAGE_신청자 자산을 여십시오.

    2. 이름 편집 이름 편집 아이콘 아이콘을 클릭하십시오.

    3. 이름을 다음으로 변경하십시오.

      MORTGAGE_APPLICANTS_TRUST
      
    4. 적용을 클릭하십시오.

체크포인트 아이콘 진행 상태 확인

다음 이미지는 카탈로그에 공개된 강화된 데이터 자산을 표시합니다. 이제 회사의 카탈로그를 통해 신뢰할 수 있는 데이터를 사용할 수 있습니다.

카탈로그에 공개된 자산



통제 팀의 데이터 스튜워드로서, 데이터 이용자가 셀프 서비스 카탈로그에서 쉽게 찾을 수 있는 고품질의 보호된 데이터 자산을 제공하기 위해 회사의 데이터를 정렬하고 구성하는 방법을 학습했습니다.

다음 단계

이제 데이터 보호 규칙 및 마스킹 플로우를 작성하여 데이터에 대한 액세스를 제어하여 데이터를 보호할 준비가 되었습니다.데이터 보호 학습서를 참조하십시오.

자세한 정보

상위 주제: 유스 케이스 학습서

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기