0 / 0
영어 버전 문서로 돌아가기
데이터 통합 학습서: 외부 데이터 가상화
마지막 업데이트 날짜: 2024년 11월 28일
데이터 통합 학습서: 외부 데이터 가상화

이 튜토리얼을 통해 데이터 패브릭 평가판의 데이터 통합 유스 케이스를 사용하여 세 개의 외부 데이터 소스에 저장된 데이터를 가상화합니다. 목표는 Data Virtualization 사용하여 가상 테이블을 만들고, 세 가지 데이터 소스( Db2 Warehouse, PostgreSQL 데이터베이스, MongoDB 데이터베이스)에 있는 기존 데이터에서 가상 테이블을 조인하는 것입니다. 데이터 통합 자습서를 완료했다면 이 자습서에서 Data Virtualization 사용하여 수행하는 것과 동일한 많은 작업을 DataStage 사용하여 수행한 것입니다.

빠른 시작: 이 학습서의 샘플 프로젝트를 아직 작성하지 않은 경우 자원 허브에서 데이터 통합 샘플 프로젝트 에 액세스하십시오.

이 학습서의 내용은 골든 뱅크가 자격을 갖춘 대출 신청자에게 대출할 수 없는 새로운 규정을 고수할 필요가 있다는 것입니다. Data Virtualization 사용하여 데이터 이동 없이 서로 다른 데이터 원본의 데이터를 결합하고 프로젝트의 다른 데이터 과학자 및 데이터 엔지니어가 가상 데이터를 사용할 수 있도록 합니다.

다음 애니메이션 이미지는 이 학습서의 끝에서 수행할 작업에 대한 빠른 미리보기를 제공합니다. 외부 데이터 소스에 연결하고, 가상 테이블 및 뷰를 작성하고, 이를 프로젝트에 추가합니다. 더 큰 이미지를 보려면 이미지를 클릭하십시오.

애니메이션 이미지

튜토리얼 미리보기

이 학습서에서는 다음 태스크를 완료합니다.

비디오 시청 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.





이 학습을 완료하기 위한 팁
다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.

비디오 사진 사용

팁: 비디오를 시작한 후 학습을 통해 화면이동하면 비디오가 그림 모드로 이동합니다. 사진에서 가장 좋은 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료하면서 비디오를 따라갈 수 있습니다. 각 태스크에 대한 시간소인을 클릭하여 수행하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장 사용 방법

커뮤니티에서 도움 받기

이 튜토리얼에 도움이 필요하면 Cloud Pak for Data 커뮤니티 토론 포럼에서 질문하거나 답변을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.



전제조건 설정

Cloud Pak for Data as a Service 가입

Cloud Pak for Data as a Service 에 등록하고 데이터 통합 유스 케이스에 필요한 서비스를 프로비저닝해야 합니다.

  • 기존 Cloud Pak for Data as a Service 계정이 있는 경우 이 튜토리얼을 시작할 수 있습니다. Lite 플랜 계정이 있는 경우에는 계정당 한 명의 사용자만 이 학습서를 실행할 수 있습니다.
  • Cloud Pak for Data as a Service 계정이 아직 없는 경우에는 데이터 패브릭 평가판에 등록하십시오.

비디오 아이콘 다음 동영상을 통해 Cloud Pak for Data 데이터 패브릭에 대해 알아보세요.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

필요한 프로비저닝된 서비스 확인

학습서 비디오 미리보기 이 작업을 미리 보려면 01:06부터 시작하는 동영상을 시청하세요.

필요한 서비스를 확인하거나 프로비저닝하려면 다음 단계를 수행하십시오.

  1. 탐색 메뉴 ' 탐색 메뉴'에서 서비스 > 서비스 인스턴스를 선택합니다.

  2. 제품 드롭다운 목록을 사용하여 기존 Data Virtualization 서비스 인스턴스가 있는지 확인합니다.

  3. Data Virtualization 서비스 인스턴스를 만들어야 하는 경우 서비스 추가를 클릭합니다.

    1. Data Virtualization을 선택하십시오.

    2. Lite 플랜을 선택하십시오.

    3. 작성을 클릭하십시오.

  4. Data Virtualization 서비스가 프로비저닝되는 동안 기다리세요. 완료하는 데 몇 분 정도 걸릴 수 있습니다.

  5. 다음과 같은 추가 서비스를 확인하거나 프로비저닝하려면 다음 단계를 반복하십시오.

    • IBM Knowledge Catalog
    • Cloud Object Storage

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로비저닝된 서비스 인스턴스를 표시합니다.

프로비저닝된 서비스

샘플 프로젝트 작성

학습서 비디오 미리보기 이 작업을 미리 보려면 01:46부터 시작하는 동영상을 시청하세요.

이 학습서에 대한 샘플 프로젝트가 이미 있는 경우 태스크 1로 건너뛰십시오. 그렇지 않으면, 다음 단계를 수행하십시오.

  1. 리소스 허브에서 데이터 통합 샘플 프로젝트에 액세스합니다.

  2. 프로젝트 작성을 클릭하십시오.

  3. 프로젝트를 Cloud Object Storage 인스턴스에 연관시키도록 프롬프트가 표시되면 목록에서 Cloud Object Storage 인스턴스를 선택하십시오.

  4. 작성을 클릭하십시오.

  5. 프로젝트 가져오기가 완료될 때까지 기다린 후 새 프로젝트 보기 를 클릭하여 프로젝트 및 자산이 성공적으로 작성되었는지 확인하십시오.

  6. 자산 탭을 클릭하여 연결 및 DataStage 플로우를 확인하십시오.

참고: 이 유스 케이스에 포함된 학습서를 보여주는 둘러관련 프로그램을 볼 수 있습니다. 안내식 둘러보기의 링크는 이 학습서 지시사항을 엽니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 샘플 프로젝트의 자산 탭을 표시합니다. 이제 학습서를 시작할 준비가 되었습니다.

샘플 프로젝트




태스크 1: Platform assets catalog 확인

학습서 비디오 미리보기 이 작업을 미리 보려면 02:42부터 시작하는 동영상을 시청하세요.

플랫폼 레벨 또는 서비스 레벨에서 외부 데이터 소스에 대한 연결을 추가할 수 있습니다. Platform assets catalog 사용하여 플랫폼 수준에서 연결을 추가하면 프로젝트, 카탈로그 및 Data Virtualization 데이터 소스에 해당 연결을 쉽게 포함할 수 있습니다. 다음 단계에 따라 Platform assets catalog를 확인하십시오.

  1. 탐색 메뉴 ' 탐색 메뉴'에서 데이터 > 플랫폼 연결을 선택합니다.

  2. 기존 연결이 표시되면 Platform assets catalog가 이미 있는 것이므로 태스크 2로 건너뛸 수 있습니다. 연결이 표시되지 않지만 새 연결을 만들 수 있는 옵션이 표시되면 작업 2로 건너뛸 수 있습니다.
    '새 연결 단추

  3. Platform assets catalog 없는 경우 카탈로그 생성을 클릭합니다. 플랫폼 자원 파일 카탈로그 작성

  4. 목록에서 Cloud Object Storage 를 선택하십시오.

  5. 중복 자산 처리의 기본값을 승인하십시오.

  6. 작성을 클릭하십시오. 플랫폼 연결 페이지가 표시됩니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 플랫폼 연결을 표시합니다. 여기에서 연결을 작성할 수 있습니다. 샘플 프로젝트에 연결이 포함되어 있으므로 샘플 프로젝트에서 이 카탈로그에 외부 데이터 소스에 대한 연결을 추가할 수 있습니다.

Platform assets catalog




태스크 2: Platform assets catalog 에 데이터 연결 추가

학습서 비디오 미리보기 이 작업을 미리 보려면 03:22부터 시작하는 동영상을 시청하세요.

데이터 통합 샘플 프로젝트에는 외부 데이터 소스에 대한 여러 연결이 포함되어 있습니다. 다음으로 Platform assets catalog 세 개의 연결을 추가한 다음 Data Virtualization 이러한 연결을 사용할 수 있도록 설정합니다. 다음 단계에 따라 샘플 프로젝트에서 Platform assets catalog로의 연결을 공개하십시오.

  1. 탐색 메뉴 ' 탐색 메뉴에서 프로젝트 > 모든 프로젝트 보기를 선택합니다.

  2. 데이터 통합 프로젝트를 클릭하십시오.

  3. 자산 탭을 클릭하십시오.

  4. 자산 유형아래에서 데이터 액세스 > 연결을 클릭하십시오.

  5. 다음 연결 자산을 선택하십시오.

    • Data Fabric 평가판- Db2 Warehouse
    • Data Fabric 평가판- MongoDB
    • Data Fabric 평가판- Databases for PostgreSQL
  6. 카탈로그에 공개를 클릭하십시오.

    1. 목록에서 플랫폼 자산 카탈로그 를 선택하고 다음을 클릭하십시오.

    2. 자산을 검토하고 공개를 클릭하십시오.

  7. 탐색 메뉴 ' 탐색 메뉴'에서 데이터 > 플랫폼 연결을 선택하여 카탈로그에 게시된 세 가지 연결을 확인합니다.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 세 개의 플랫폼 연결을 표시합니다. 이제 데이터 소스를 추가할 준비가 되었습니다.

세 개의 플랫폼 연결




작업 3: Data Virtualization 데이터 원본 추가하기

학습서 비디오 미리보기 이 작업을 미리 보려면 04:05부터 시작하는 동영상을 시청하세요.

이제 Platform assets catalog 이러한 외부 데이터 소스를 Data Virtualization 추가할 수 있습니다. 데이터 소스를 추가하려면 다음 단계를 수행하십시오.

  1. 탐색 메뉴 ' 탐색 메뉴'에서 데이터 > Data virtualization 선택합니다.

    참고: 통제를 적용하도록 기본 카탈로그 설정에 대한 알림이 표시되면 이 알림을 안전하게 닫을 수 있습니다. 기본 카탈로그 설정은 선택사항입니다.
  2. 데이터 원본 페이지의 테이블 보기에서 연결 추가 > 기존 플랫폼 연결을 클릭합니다.
    ' 기존 연결 추가'

  3. Data Fabric 평가판- Db2 Warehouse를 선택하십시오.

  4. 추가 를 클릭하십시오.

  5. 이 단계를 반복하여 Data Fabric 평가판-Mongo DBData Fabric 평가판- Databases for PostgreSQL 연결을 추가하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 데이터 소스를 표시합니다. 이제 해당 외부 데이터 소스에 저장된 데이터에서 가상 테이블을 작성할 준비가 되었습니다.

데이터 소스




태스크 4: 데이터 테이블 가상화

학습서 비디오 미리보기 이 작업을 미리 보려면 04:40부터 시작하는 동영상을 시청하세요.

MORTGAGE_APPLICATION, MORTGAGE_신청자CREDIT_SCORES 테이블을 가상화하려고 합니다. 나중에 처음 두 개의 가상 테이블을 세 번째 테이블과 결합하여 새 가상 결합 보기를 작성할 수 있습니다. 데이터 테이블을 가상화하려면 다음 단계를 수행하십시오.

  1. 서비스 메뉴에서 가상화 > 가상화를 클릭합니다.
    ' 서비스 메뉴에서 가상화

  2. 필요한 경우 테이블 보기로 변경하고 테이블이 로드되는 동안 기다리십시오. 최대 30초가 소요될 수 있습니다. 테이블의 전체 목록을 보려면 새로 고치기 를 클릭해야 합니다. 사용 가능한 테이블이 표시되면 모든 테이블이 로드됩니다. 테이블 수는 다를 수 있습니다.
    ' 사용 가능한 테이블 목록 가상화

  3. 테이블 탭에서 다음 기준에 따라 테이블을 필터링하십시오.

    1. 커넥터: IBM Db2 WarehousePostgreSQL

    2. 데이터베이스: Data Fabric 평가판- Db2 WarehouseData Fabric 평가판- Databases for PostgreSQL

    3. 스키마: BANKING

  4. 가상화할 MORTGAGE_APPLICATION, MORTGAGE_신청자CREDIT_SCORE 테이블을 선택하십시오. 테이블 이름 위로 마우스를 이동하여 전체 이름을 보고 올바른 테이블 이름을 선택했는지 확인할 수 있습니다.

  5. 카트에 추가를 클릭하십시오.

  6. 카트 보기 를 클릭하여 선택사항을 보십시오. 여기에서 테이블 및 스키마 이름을 편집하거나 카트에서 선택사항을 제거할 수 있습니다.

  7. 지금은 프로젝트에 지정옆에 있는 선택란을 지우십시오. 이 조치를 수행하면 가상화된 데이터 페이지에서 가상 테이블을 사용할 수 있습니다.

  8. 가상화를 클릭하십시오.

  9. 확인 을 클릭하여 테이블 가상화를 시작하십시오.

  10. 가상화가 완료되면 가상화된 데이터로 이동 을 클릭하여 새로 작성된 테이블을 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 가상화된 데이터 페이지를 표시합니다. 이제 이러한 가상 테이블을 결합하여 가상 테이블을 작성할 준비가 되었습니다.

데이터 가상화




태스크 5: 가상 테이블을 결합하여 가상 결합 보기 작성

MORTGAGE_신청자및 MORTGAGE_APPLICATION 가상 테이블을 결합하여 가상 결합 보기를 작성하려고 합니다. 그런 다음, 결과 가상 오브젝트를 CREDIT_SCORE 가상 테이블과 조인하여 두 번째 가상 조인 뷰를 작성하려고 합니다.

가상 결합 보기 1: MORTGAGE_신청자및 MORTGAGE_APPLICATION 가상 테이블 결합

학습서 비디오 미리보기 이 작업을 미리 보려면 05:59부터 시작하는 동영상을 시청하세요.

첫 번째 가상 결합 보기를 작성하려면 다음 단계를 수행하십시오.

  1. 가상화된 데이터 페이지에서 가상화할 MORTGAGE_APPLICATIONMORTGAGE_신청자 테이블을 선택하십시오.

  2. 스키마 이름을 기록해 두십시오. 나중에 SQL 조회를 실행하려면 이 이름이 필요합니다.

  3. 결합을 클릭하십시오.

  4. 모기지_신청 테이블의 열 목록에서 ID 열을 끌어서 모기지_신청자 테이블의 ID 열과 연결합니다.
    ' 키에 대한 ID를 사용하여 가상 오브젝트 결합

  5. 두 테이블 모두에서 모든 컬럼을 선택하십시오.

  6. 결합된 테이블의 미리보기를 보려면 미리보기 를 클릭하십시오.

  7. 미리보기 창을 닫으십시오.

  8. SQL 편집기에서 열기를 클릭한 후 결합 캔버스로 돌아갈 수 없음을 알리는 알림에서 계속 을 클릭하십시오. SQL 편집기를 사용하여 데이터 세트에 대한 조회를 실행할 수 있습니다. 이 경우 캘리포니아 신청자를 필터링할 때 데이터 세트에 포함될 레코드를 미리 보려고 합니다.

    SQL 편집기 열기

    1. 스키마를 복사한 후 기존 조회를 삭제하십시오. 다음 SQL문에 스키마를 삽입해야 합니다.

    2. 새 조회에 대해 다음 SELECT문을 복사하여 붙여넣으십시오. <your schema> 를 이전에 기록한 스키마 이름으로 바꾸십시오.

      SELECT * FROM <your-schema>.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
      

      쿼리는 다음과 유사합니다. SELECT * FROM DV_IBMID_663002GN1Q.MORTGAGE_APPLICANT WHERE STATE_CODE LIKE 'CA'
      ' 선택 명령문'

    3. 모두 실행을 클릭하십시오.

    4. 조회가 완료되면 히스토리 탭에서 조회를 선택하십시오. 결과 탭에서 테이블이 캘리포니아 주의 신청자로만 필터링되는 것을 볼 수 있습니다.

    5. 이전 을 클릭하여 SQL 편집기를 닫으십시오.

  9. 캘리포니아 지원자에서 필터링된 데이터 세트를 미리 보았으므로 이 필터 기준을 가상 결합 보기에 추가합니다. MORTGAGE_신청자 테이블의 경우 필터 기준에 대해 다음 명령문을 복사하여 붙여넣으십시오. <your schema> 를 이전에 기록한 스키마 이름으로 바꾸십시오.

    "<your-schema>"."MORTGAGE_APPLICANT"."STATE_CODE"='CA'
    

    필터 기준은 "DV_IBMID_663002GN1Q""."MORTGAGE_APPLICANT"."STATE_CODE"='CA'와 유사하게 보입니다

    필터 기준

  10. 다음 을 클릭하십시오.

  11. 두 테이블에서 동일한 이름을 가진 열을 구별하도록 열 이름을 편집할 수 있습니다. 이 경우 기본 열 이름을 유지하고 다음을 클릭하십시오.

  12. 지정 및 검토 페이지에서 보기 이름APPLICANTS_APPLICATIONS_JOINED를 입력하십시오.

  13. 지금은 프로젝트에 지정 옵션을 선택 취소하십시오. 나중에 가상 오브젝트를 작성하고 이를 데이터 통합 프로젝트에 지정합니다.

  14. 뷰 작성을 클릭하십시오.

  15. 가상화가 완료되면 가상화된 데이터로 이동 을 클릭하여 새로 작성된 결합 보기를 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 가상화된 데이터 페이지를 표시합니다. 이제 두 번째 가상 결합 보기를 작성할 준비가 되었습니다.

데이터 가상화

가상 조인 뷰 2: APPLICANTS_APPLICATIONS_JOIN및 CREDIT_SCORE 가상 테이블 조인

학습서 비디오 미리보기 이 작업을 미리 보려면 07:47부터 시작하는 동영상을 시청하세요.

두 번째 가상 결합 보기를 작성하려면 다음 단계를 수행하십시오.

  1. 가상화된 데이터 페이지에서 가상화할 APPLICANTS_APPLICATIONS_JOINEDCREDIT_SCORE 테이블을 선택하십시오.

  2. 결합을 클릭하십시오.

  3. APPLICANTS_APPLICATIONS_JOINED 테이블의 열 목록에서 끌어서 CREDIT_SCORE 테이블의 EMAIL_ADDRESS 열과 EMAIL_ADDRESS 열을 연결하십시오.

  4. 결합된 테이블의 미리보기를 보려면 미리보기 를 클릭하십시오.

  5. 미리보기 창을 닫으십시오.

  6. 다음 을 클릭하십시오.

  7. 기본 열 이름을 승인하고 다음을 클릭하십시오.

  8. 지정 및 검토 페이지에서 보기 이름APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED를 입력하십시오.

  9. 이번에는 프로젝트에 지정 을 선택한 상태로 두고 데이터 통합 프로젝트를 선택하십시오.

  10. 뷰 작성을 클릭하십시오.

  11. 가상화가 완료되면 가상화된 데이터로 이동 을 클릭하여 새로 작성된 결합 보기를 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 가상화된 데이터 페이지를 표시합니다. 이제 프로젝트의 가상 데이터에 대해 작업할 준비가 되었습니다.

데이터 가상화




태스크 6: API키 생성

학습서 비디오 미리보기 이 작업을 미리 보려면 08:27부터 시작하는 동영상을 시청하세요.

가상화된 자산을 보려면 API키 양식으로 개인 신임 정보를 제공해야 합니다. 아직 저장된 API 키가 없는 경우에는 다음 단계를 수행하여 API 키를 작성합니다.

  1. IBM Cloud 콘솔의 API 키 페이지에 액세스합니다. 프롬프트가 표시되면 로그인하십시오.

  2. API키 페이지에서 IBM Cloud API키 작성을 클릭하십시오. 기존 API키가 있는 경우 단추에 작성이라는 레이블이 붙을 수 있습니다.

  3. 이름 및 설명을 입력하십시오.

  4. 작성을 클릭하십시오.

  5. 복사 API 키입니다.

  6. 나중에 사용할 수 있도록 API 키를 다운로드하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 API키 페이지를 표시합니다. 이제 프로젝트에서 가상 테이블을 볼 준비가 되었습니다.

API키 페이지




태스크 7: 프로젝트의 가상 결합 보기에 액세스

학습서 비디오 미리보기 이 작업을 미리 보려면 09:01부터 시작하는 동영상을 시청하세요.

가상 테이블이 Data Virtualization 대한 연결과 함께 프로젝트에 추가되었습니다. 다음 단계에 따라 프로젝트를 열어 가상 데이터 및 가상 데이터에 액세스하는 데 필요한 연결 정보를 확인하십시오.

  1. Cloud Pak for Data로 다시 전환하십시오. 탐색 메뉴 ' 탐색 메뉴에서 프로젝트 > 모든 프로젝트 보기를 선택합니다.

  2. 데이터 통합 프로젝트를 여십시오.

  3. 자산 탭을 클릭하십시오.

  4. 가상화된 데이터를 여십시오. 예를 들어, 스키마 이름으로 시작하고 APPLICANTS_APPLICATIONS_CREDIT_SCORE_JOINED 가 뒤따르는 데이터 자산을 클릭하여 보십시오.

  5. 데이터 자산에 액세스하기 위한 신임 정보를 제공하십시오.

  6. 인증 방법으로 API키를 선택하십시오.

  7. API 키를 붙여넣습니다.
    ' API키 붙여넣기

  8. 연결을 클릭하십시오.

  9. 데이터 자산을 스크롤하여 캘리포니아 주의 모든 신청자를 확인하십시오.

체크포인트 아이콘 진행 상황 확인

다음 이미지는 프로젝트의 가상 데이터를 표시합니다. 이제 가상 데이터를 분석할 준비가 되었습니다.

가상 테이블 보기



Golden Bank의 데이터 엔지니어로서 Data Virtualization 사용하여 다양한 데이터 원본과 다양한 유형의 데이터를 결합했습니다. SQL 구문을 사용하고 데이터 이동 없이 데이터에 액세스하여 결합했습니다.


정리 (선택사항)

데이터 통합 유스 케이스에서 학습서를 다시 가져오려면 다음 아티팩트를 삭제하십시오.

아티팩트 삭제 방법
Platform assets catalog 의 연결 카탈로그에서 자산 제거
데이터 가상화 데이터 > Data virtualization 이동하고, 가상화된 데이터 페이지에서 테이블의 오버플로 메뉴 ' 오버플로우 메뉴 '에 액세스하여 제거를 선택합니다.
데이터 소스 데이터 > Data virtualization 이동하고, 데이터 소스 페이지에서 연결에 대한 삭제 아이콘 ' 삭제 '을 클릭합니다.
데이터 통합 샘플 프로젝트 프로젝트 삭제

다음 단계

자세한 정보

상위 주제: 유스 케이스 학습서