0 / 0
영어 버전 문서로 돌아가기
데이터 관리 학습서: 데이터 이용
마지막 업데이트 날짜: 2024년 11월 28일
데이터 관리 학습서: 데이터 이용

고품질 데이터 큐레이션 튜 토리얼과 데이터 패브릭 평가판의 데이터 거버넌스 사용 사례로 데이터 보호 튜토리얼을 완료한 후 이 튜토리얼을 통해 고품질의 보호된 데이터로 작업하세요. 데이터 패브릭에서 데이터를 평가, 공유, 구체화 및 분석하는 것이 목표입니다.

빠른 시작: 이 학습서의 샘플 프로젝트를 아직 작성하지 않은 경우 자원 허브에서 데이터 관리 샘플 프로젝트 에 액세스하십시오.

이 학습서의 내용은 골든 뱅크에는 고품질의 고객 모기지 데이터에 대한 액세스가 필요한 여러 부서가 있다는 점입니다. 데이터 분석가는 올바른 데이터를 검색하여 찾고 해당 컨텐츠를 이해하고 신뢰한 다음 다른 데이터 분석가 및 데이터 과학자가 사용할 수 있도록 준비해야 합니다.

다음 애니메이션 이미지는 카탈로그 자산을 보고, 수동으로 자산을 보강하고, 관계를 작성하고, 데이터를 시각화하고, 품질을 개선하기 위해 데이터를 필터링하는 이 학습의 끝에서 수행할 작업에 대한 빠른 미리보기를 제공합니다. 더 큰 이미지를 보려면 이미지를 클릭하십시오.

애니메이션 이미지

튜토리얼 미리보기

이 학습서에서는 다음 태스크를 완료합니다.

비디오 시청 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.





이 학습을 완료하기 위한 팁
다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.

비디오 사진 사용

팁: 비디오를 시작한 후 학습을 통해 화면이동하면 비디오가 그림 모드로 이동합니다. 사진에서 가장 좋은 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료하면서 비디오를 따라갈 수 있습니다. 각 태스크에 대한 시간소인을 클릭하여 수행하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장 사용 방법

커뮤니티에서 도움 받기

이 튜토리얼에 도움이 필요하면 Cloud Pak for Data 커뮤니티 토론 포럼에서 질문하거나 답변을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.



전제조건 설정

전제조건 학습서 완료

학습서 비디오 미리보기 이 작업을 미리 보려면 00:39부터 시작하는 동영상을 시청하세요.

고품질 데이터데이터 보호 학습서를 완료하십시오.

  • 고품질 데이터 작성 학습서는 데이터 자산을 가져오고 강화하며 카탈로그에 공개합니다.
  • 데이터 보호 데이터 보호 규칙 및 마스킹 플로우를 작성하여 데이터를 보호하는 학습서

기본 프리미엄 표준 별도의 언급이 없는 한, 이 정보는 IBM Knowledge Catalog 모든 버전에 적용됩니다.




태스크 1: 데이터 자산 이해

학습서 비디오 미리보기 이 작업을 미리 보려면 01:12부터 시작하는 동영상을 시청하세요.

카탈로그의 데이터 자산은 데이터에 대한 포인터 이상의 것입니다. 데이터의 형식 및 의미에 대한 정보와 데이터 값에 대한 통계가 포함되어 있습니다. 데이터 자산의 가치를 이해하려면 다음 단계를 수행하십시오.

  1. 탐색 메뉴 ' 탐색 메뉴에서 카탈로그 > 모든 카탈로그 보기를 선택합니다.

  2. 모기지 승인 카탈로그를 여십시오.

  3. 주요 자산 섹션에는 최근에 추가된 자산, 과거 사용량 및 인기도 기반으로 AI및 머신 러닝에서 제안된 자산인 권장 자산 및 카탈로그 협업자가 평가하고 검토한 높은 등급 자산이 표시됩니다.

  4. 해당 섹션을 닫으려면 기능 자산 숨김을 클릭하십시오.

  5. mortgage을(를) 검색하십시오.

  6. MORTGAGE_APPLICANTS_TRUST 를 클릭하여 해당 카탈로그 자산을 보십시오. 개요 탭 및 측면 패널은 자산에 대한 기본 정보 (예: 설명, 등급, 태그, 자산이 있는 위치, 비즈니스 용어, 데이터 클래스 및 관련 항목) 를 제공합니다.

  7. 프로파일 탭을 클릭하십시오. 프로파일 정보는 데이터의 컨텐츠, 품질 및 사용성을 이해하는 데 도움이 됩니다.

  8. 오른쪽으로 스크롤하여 ZIP_CODE 열을 찾으십시오.

  9. ZIP_CODE 열에 자동으로 지정된 데이터 클래스는 상업 및 정부 엔티티입니다. 자동으로 지정된 데이터 클래스는 다를 수 있습니다. 값은 우편번호이므로 이 열을 쉽게 재분류할 수 있습니다. 다른 가능한 데이터 클래스 및 해당 신뢰수준을 보려면 드롭 다운 목록을 클릭하십시오. 미국 우편번호를 선택하십시오.

  10. 데이터 미리보기를 보려면 자산 탭을 클릭하십시오.

  11. 열에 대한 추가 메타데이터를 보려면 개요 탭으로 돌아가십시오. 열 목록에서 EMPLOYMENT_STATUS 열을 검색하여 지정된 비즈니스 용어를 포함한 메타데이터를 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 카탈로그의 MORTGAGE_APPLICANTS_TRUST 자산을 표시합니다. 메타데이터 강화 중에 IBM Knowledge Catalog 가 자동으로 데이터 자산에 추가하는 정보의 유형을 탐색했습니다. 다음 태스크에서는 이 데이터 자산을 수동으로 강화합니다.

MORTGAGE_APPLICANTS_TRUST 자산




태스크 2: 자산 강화 및 관계 작성

학습서 비디오 미리보기 이 작업을 미리 보려면 02:49부터 시작하는 동영상을 시청하세요.

자산에 정보를 추가하여 자산을 더 가치있게 만들 수 있습니다. 예를 들어, 자산에 대한 의견을 추가하고, 자산 특성을 업데이트하고, 자산을 링크하기 위한 관계를 작성할 수 있습니다. 자산을 강화하고 관계를 작성하려면 다음 단계를 수행하십시오.

  1. MORTGAGE_APPLICANTS_TRUST 카탈로그 자산의 경우 검토 탭을 클릭하십시오. 다른 사용자가 쉽게 자산을 찾을 수 있도록 이 자산에 대한 등급을 지정하고 주석을 추가하십시오.

    1. 등급에 대해 별 5개를 선택하십시오.

    2. 검토를 위해 다음 텍스트를 복사하여 붙여넣으십시오.

      This contains high quality customer data from the mortgage system.
      
    3. 제출을 클릭하십시오.

  2. Overview 탭을 클릭하십시오.

  3. 에셋 이름 옆의 편집 아이콘 ' 편집 '을 클릭하여 에셋 이름을 편집합니다.

    1. 이름을 다음으로 변경하십시오.

      MORTGAGE_APPLICANTS_TRUST_PROTECT
      
    2. 적용을 클릭하십시오.

  4. 오른쪽 패널의 설명 섹션에서 추가 아이콘 ' 추가'을 클릭합니다.

    참고:

    이 자산에 기존 설명이 있는 경우 추가 아이콘 대신 ' 편집 ' 편집 아이콘이 표시됩니다.

    1. 다음 설명을 복사하여 붙여넣으십시오.

      Mortgage applicants from the Mortgage System
      
    2. 적용을 클릭하십시오.

  5. 이 자산은 모기지 대출과 관련이 있으므로 비즈니스 약관 옆의 추가 아이콘 ' 추가 ' 또는 편집 아이콘 ' 편집'를 클릭합니다.

    1. 검색 필드에 loan를 입력하십시오.

      주: 검색 용어를 입력한 후에는 Enter를 누를 필요가 없습니다. 검색 용어를 입력하면 즉시 결과 목록이 표시됩니다.
    2. 대출을 선택하십시오.

    3. 저장 을 클릭하십시오.

  6. 이 자산에는 개인정보가 포함되어 있으므로 분류 옆에 있는 추가 아이콘 ' 추가 ' 또는 편집 아이콘 ' 편집'를 클릭합니다.

    1. 개인을 식별할 수 있는 정보를 선택하십시오.

    2. 저장 을 클릭하십시오.

  7. 이 자산은 다른 모기지 자산과 관련되어 있으므로 관련 항목옆에서 관련 항목 추가 > 관련 자산 추가를 클릭하십시오.

    1. Is related to를 선택하고 다음을 클릭하십시오.

    2. CREDIT_SCOREMORTGAGE_APPLICATION 자산을 선택하고 추가를 클릭하십시오.

  8. 관련 자산을 보려면 MORTGAGE_APPLICATION을 클릭하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 카탈로그의 MORTGAGE_APPLICANTS_TRUST_PROTECT 자산에 대한 개요 탭을 표시합니다. 자산을 검토하고 특성을 업데이트하며 자산에 관계를 추가하여 이러한 자산을 더 가치있게 만들었습니다. 다음 태스크에서는 보강된 자산을 프로젝트에 추가합니다.

관련 자산이 있는 MORTGAGE_APPLICANTS_TRUST




태스크 3: 프로젝트에 강화된 데이터 추가

학습서 비디오 미리보기 이 작업을 미리 보려면 04:09부터 시작하는 동영상을 시청하세요.

데이터 분석가 팀은 모델에 대한 훈련 데이터로 세분화, 시각화, 분석 및 사용하기 위해 모기지 분석 프로젝트의 모기지 신청자 데이터가 필요합니다. 다음 단계에 따라 강화된 데이터를 프로젝트에 추가하십시오.

  1. 탐색 경로에서 모기지 승인 카탈로그를 클릭합니다.
    ' 탐색 추적

  2. MORTGAGE_APPLICANTS_TRUST_PROTECT 카탈로그 자산 행의 끝에서 오버플로 메뉴 ' 오버플로우 메뉴'을 클릭하고 프로젝트에 추가를 선택합니다.

    1. 대상 드롭 다운 목록에서 데이터 거버넌스 프로젝트를 선택하십시오.

    2. 추가 를 클릭하십시오.

  3. 알림이 표시되면 프로젝트로 이동을 클릭하십시오. 알림이 누락되면 다음을 수행하십시오.

    1. 탐색 메뉴 ' 탐색 메뉴'을 클릭하고 프로젝트 > 모든 프로젝트 보기를 선택합니다.

    2. 데이터 거버넌스 프로젝트를 클릭하십시오.

  4. 프로젝트에서 자산 탭을 클릭하여 MORTGAGE_APPLICANTS_TRUST_PROTECT 데이터 자산을 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로젝트의 MORTGAGE_APPLICANTS_TRUST_PROTECT 자산을 표시합니다. 이제 데이터를 시각화할 준비가 되었습니다.

프로젝트의 MORTGAGE_APPLICANTS_TRUST_PROTECT 자산




태스크 4: 데이터 시각화

학습서 비디오 미리보기 이 작업을 미리 보려면 04:39부터 시작하는 동영상을 시청하세요.

분석 도구 및 모델을 준비하기 위해 모기지 신청자 데이터를 정리하고 세분화해야 합니다. Data Refinery에서 데이터를 시각화하는 것이 필요한 방식을 빠르고 쉽게 결정하는 방법입니다. 시각화는 데이터의 처음 5,000개 행을 기반으로 합니다. 데이터를 시각화하려면 다음 단계를 수행하십시오.

  1. MORTGAGE_APPLICANTS_TRUST_PROTECT 데이터 자산을 클릭하여 데이터를 미리보십시오.

  2. 데이터 준비 를 클릭하여 Data Refinery에서 데이터 자산을 열고 데이터를 읽고 처리할 때까지 기다리십시오.

  3. 이 자산 정보 패널에서 X 를 클릭하여 패널을 닫으십시오.

  4. 단계 패널에서 X 를 클릭하여 패널을 닫으십시오.

  5. 시각화 탭을 클릭하십시오.

  6. 시각화할 열에 대해 EMPLOYMENT_STATUS를 선택하십시오.

  7. 데이터 시각화를 클릭하십시오. 도구는 이 열에 대한 가장 적합한 차트 유형으로 원형 차트를 선택하며, 이는 고용 상태별 지원자 분포를 표시합니다. 막대, 단어 클라우드 및 선버스트 옆에 파란색 점으로 표시되는 제안된 차트 유형을 확인하십시오.

  8. 차트 유형에 대해 풍선 차트 유형을 선택하십시오. 거품형 차트는 특정 데이터 세트에서 값의 분포를 빠르게 시각화하는 쉬운 방법입니다.

  9. 차트 유형 드롭 다운에서 관계 차트 유형을 선택하십시오.

  10. 이 차트 유형에는 두 개의 열이 필요합니다. 다음 열을 선택하십시오.

    1. 첫 번째 열에 대해 EMPLOYMENT_STATUS를 선택하십시오.

    2. 다른 열 추가를 클릭하십시오.

    3. 두 번째 에 대해 EDUCATION를 선택하십시오.

  11. 관계 차트를 사용하면 엔드포인트를 선택하여 관계를 볼 수 있습니다. 예를 들어, 교육 레벨별로 지원자의 고용 상태를 볼 수 있습니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 Data Refinery에서 시각화된 MORTGAGE_APPLICANTS_TRUST_PROTECT 자산을 표시합니다. 이제 데이터를 정리할 준비가 되었습니다.

관계 시각화




태스크 5: 분석 및 AI를 위한 데이터 준비

학습서 비디오 미리보기 이 작업을 미리 보려면 05:59부터 시작하는 동영상을 시청하세요.

주민등록번호가 없으면 지원자를 처리할 수 없으므로 데이터를 검토하고 주민등록번호가 없는 지원자는 제거해야 합니다. MORTGAGE_APPLICANTS_TRUST_PROTECT 데이터를 준비하기 위해 다음을 수행합니다.

  • Social_Security_Number 컬럼에서 값의 빈도를 보십시오.
  • Social_Security_Number열에서 누락된 값이 있는 신청자를 필터링하십시오.

데이터를 준비하려면 다음 단계를 수행하십시오.

  1. Data Refinery에서 프로파일 탭을 클릭하십시오.

  2. 오른쪽으로 스크롤하여 Social_Security_Number 컬럼을 찾으십시오. 여러 개의 결측값을 확인하십시오.

  3. 데이터 탭을 클릭하여 이러한 레코드를 필터링하십시오. 화면 맨 아래에 있는 상태 표시줄에서 Data Refinery 는 FULL DATA SET 가 1101행임을 표시합니다.

  4. 단계 패널이 표시되지 않으면 단계 를 클릭하여 패널을 여십시오.

  5. 새 단계를 클릭하십시오.

    1. 정리 섹션에서 필터를 선택하십시오.

    2. 필드에서 Social_Security_Number 열을 선택하십시오.

    3. 연산자 필드에서 비어 있지 않음을 선택하십시오.

    4. 적용을 클릭하십시오. 화면 맨 아래에 있는 상태 표시줄에서 Data Refinery 는 이제 FULL DATA SET 가 1000행임을 표시합니다. 누락된 주민등록번호가 있는 행이 필터링되기 때문입니다. 필터 조작을 표시하는 새 단계가 단계 패널에 표시됩니다.

  6. 프로파일 탭을 클릭하십시오.

  7. 오른쪽으로 스크롤하여 Social_Security_Number 컬럼을 찾으십시오. 누락된 값이 없습니다는므로 주의하십시오.

  8. 도구 모음에서 저장 아이콘 ' 저장'을 클릭합니다.

  9. 도구 모음에서 내보내기 아이콘을 클릭하고 현재 데이터를 CSV로 내보내기를 선택합니다.
    ' csv로 익스포트'

    1. MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv 를 로컬 폴더에 저장하십시오.

    2. 해당 폴더로 이동하여 1000개의 행이 포함되어 있고 주민등록번호가 누락된 지원자가 없는 CSV 파일을 여십시오.

  10. Cloud Pak for Data 돌아가서 탐색 트레일에서 데이터 거버넌스 프로젝트를 클릭합니다.
    ' 탐색 추적'

  11. 모든 자산을 클릭하고 이름이 MORTGAGE_APPLICANTS_TRUST_PROTECT_flow인 새 Data Refinery 플로우 자산을 찾으십시오.

팁: 정제된 데이터 세트를 프로젝트 또는 외부 데이터 소스 (예: 원래 데이터 세트가 저장된 Db2 Warehouse 인스턴스) 에 저장할 수 있습니다. 자세한 정보는 Data Refinery에서 작업 작성을 참조하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 Data Refinery에서 세분화한 MORTGAGE_APPLICANTS_TRUST_PROTECT_shaped.csv 파일을 표시합니다. 이 데이터 세트에는 주민등록번호를 제공한 모기지 신청자에 대한 정보가 포함되어 있습니다.

세분화된 데이터 자산



Golden Bank의 데이터 분석가로서, 올바른 데이터를 검색하고 찾으며, 해당 컨텐츠를 이해하고 신뢰한 후 다른 데이터 분석가 및 데이터 과학자가 사용할 수 있도록 준비하는 방법을 학습했습니다.

정리 (선택사항)

데이터 관리 유스 케이스에서 학습서를 다시 가져오려면 다음 아티팩트를 삭제하십시오.

아티팩트 삭제 방법
가져온 비즈니스 용어 거버넌스 아티팩트 삭제
뱅킹 카테고리 범주를 삭제합니다.
데이터 보호 규칙: 기밀 정보 및 개정 주민등록번호 데이터 보호 규칙 삭제
모기지 승인 카탈로그 카탈로그 삭제
데이터 관리 샘플 프로젝트 프로젝트 삭제

다음 단계

자세한 정보

상위 주제: 유스 케이스 학습서

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기