0 / 0

Data Virtualization ' Cloud Object Storage '의 파일에서 가상화된 테이블 만들기

마지막 업데이트 날짜: 2025년 3월 21일
Data Virtualization Cloud Object Storage 파일로 가상화된 테이블 만들기
Data Virtualization 에서는 오브젝트 스토리지에 파일로 저장된 데이터를 가상화하고 사용할 수 있습니다. 다음과 같은 객체 저장소의 파일에서 데이터를 가상화할 수 있습니다. 데이터 소스: 하나 이상의 파일에서 데이터를 분할하거나 결합하여 가상 테이블을 만듭니다.

시작하기 전에

클라우드 오브젝트 스토리지의 데이터에 액세스하려면 파일이 있는 데이터 소스에 대한 연결을 작성해야 합니다. 오브젝트 스토리지 데이터 소스에 대한 자세한 정보는 Data Virtualization 의 오브젝트 스토리지 데이터 소스를 참고하세요.

이 태스크에 대한 정보

Data Virtualization' Cloud Object Storage '에서 가상화된 파일에 대한 개요는 다음 동영상을 참조하세요.

이 비디오는 이 문서에 있는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.

프로시저

  1. 네비게이션 메뉴에서 " 데이터 > Data virtualization "를 클릭하면 서비스 메뉴가 나타납니다.
    서비스 메뉴는 기본적으로 데이터 소스 페이지에 열립니다.
  2. 서비스 메뉴에서 가상화 > 가상화를 클릭한 다음, 파일 탭을 클릭합니다.
    사용 가능한 데이터 소스의 목록이 표시됩니다. 사용 가능한 필터를 사용하여 표시되는 자산의 범위를 좁힐 수 있습니다.

    데이터 소스 연결을 설정할 때 버킷 이름을 지정한 경우, 개체 저장소 연결 세부사항을 확장하기 위해 [ 아래쪽 셰브런 아이콘 ]를 클릭하여 서비스 유형버킷 정보를 확인합니다. 데이터 소스 연결 설정 시 버켓 이름을 지정하지 않은 경우 버켓 입력 필드를 사용하여 엔드포인트에서 특정 버켓을 찾을 수 있습니다.

    데이터 소스 목록이 나타나지 않으면 새로 고침을 클릭하세요.새로 고치기 아이콘.

  3. 파일 및 파일 경로를 찾아보려는 오브젝트 스토리지 엔드포인트를 선택하십시오.
    Cloud Object Storage의 경우, 엔드포인트는 오브젝트 스토리지의 URL입니다.
    엔드포인트의 파일 경로 또는 버킷 목록이 표시됩니다. 파일 경로 구조를 탐색하거나, 파일 경로에서 첫 번째 파일의 내용에 대한 세부 정보를 보려면 보기 아이콘 를 클릭하십시오.

    버켓을 카트에 추가할 수 없습니다. 카트에 파일 경로를 추가하려면 파일 경로를 선택하여 경로에서 파일을 미리보고 카트에 추가하기를 클릭해야 합니다. 버킷 레벨에서 파일을 선택할 수 없습니다. 파일을 버킷의 파일 경로에 추가해야 합니다.

  4. 가상화할 파일 또는 파일 경로를 선택하고 카트에 추가를 클릭하십시오.
    중요:
    • 다중 파일을 포함하는 파일 경로에서 단일 파일을 가상화할 수 없습니다. 이 URL은 파일이 위치하고 전체 파일 경로가 가상화되는 상위 경로로 해석됩니다. 단일 파일을 가상화하려는 경우 별도의 파일 경로로 이동할 수 있습니다. 별도의 파일 경로는 가상화되거나 가상화될 다른 파일 경로의 서브파일 경로가 아니어야 합니다.
    • 가상화하려는 파일은 파일 경로 내에 있어야 하며 버킷과 동일한 레벨에 있지 않아야 합니다. 예를 들어, s3a://mynewbigsqlbucket/mydata.csv 파일을 가상화할 수 없습니다. 가상화 프로세스에서는 경로 없이 버킷 이름만 사용하여 외부 테이블을 작성할 수 없으므로 mydata.csv을(를) 파일 경로에 넣고 s3a://mynewbigsqlbucket/fi1epath1/mydata.csv을(를) 가상화해야 합니다.
  5. 파일 데이터 선택사항을 가상 파일로 미리보려면 카트 보기 를 클릭하십시오.
    이 창에서 스키마 이름을 편집하거나, 병합된 테이블에 참여하는 파일을 미리보거나, 카트에서 선택사항을 제거할 수 있습니다.

    IBM Knowledge Catalog이(가) 설치되어 있는 경우 가상 테이블을 카탈로그에 공개할 수 있습니다. 더 자세한 정보는 Data Virtualization 의 카탈로그에 가상 데이터 게시하기를 참고하세요.

  6. 권장: 파티션된 컬럼의 유형을 문자열에서 더 적합한 내용으로 업데이트하십시오. 최적의 성능을 위해 컬럼을 파티셔닝하는 적절한 유형을 수동으로 검사하고 지정하십시오.
  7. 선택 사항: 오버플로우 메뉴 아이콘 를 클릭하고 열 편집을 선택합니다.
    파티셔닝 열 로 태그 지정되지 않은 열 이름을 편집하고 드롭 다운 메뉴를 사용하여 열 유형을 변경할 수 있습니다. 편집 내용에 만족한 경우 적용을 클릭하십시오. 테이블을 가상화한 후에는 업데이트된 컬럼 이름이 표시됩니다.
    참고: IBM Cloud Object Storage 에서 일본어 데이터가 있는 JSON 파일을 가상화하고 일본어 열 이름이 올바르게 표시되지 않으면 allownonalphanumeric 옵션을 사용하여 가상화된 일본어 열 헤더를 올바르게 볼 수 있습니다. 이 옵션은 기본적으로 사용 안함으로 설정되어 있으므로 사용으로 설정해야 합니다. 자세한 내용은 가상화된 데이터에 일본어 열 이름이 올바르게 표시되지 않음을 참조하십시오.
  8. 가상화된 테이블에 적합한 공유 옵션을 선택합니다.
  9. 선택한 카탈로그에도 공개하려면 카탈로그에 공개 를 선택하십시오.
    사용 가능한 카탈로그의 목록이 드롭 다운 메뉴에 표시됩니다. 각 카탈로그는 통제되지 않음 또는 통제되지 않음으로 태그됩니다.
    참고: IBM Knowledge Catalog 에 카탈로그가 하나 이상 있어야 합니다.

    카탈로그에 공개할 수 있는 권한이 있어야 합니다. 관리자는 모든 가상 오브젝트가 선택된 통제 카탈로그에 공개되는지 여부를 사용으로 설정하여 사용자가 지정된 카탈로그에 공개하지 못하도록 할 수 있습니다.

  10. 스키마 필드에 스키마를 지정하십시오.
    다음 단계를 수행하여 스키마를 작성할 수도 있습니다.
    • Data Virtualization 엔지니어 또는 사용자 역할이 있는 경우 스키마 필드를 기본값으로 두어 사용자 ID로 스키마를 만듭니다.
    • Data Virtualization 관리자 역할이 있는 경우 스키마 필드를 기본값으로 두어 사용자 ID로 스키마를 만들거나 스키마 필드에 새 스키마 이름을 입력합니다.
    자세한 정보는 가상 오브젝트에 대한 스키마 작성을 참조하십시오.
  11. 가상화 를 클릭하여 프로세스를 완료하십시오.
    상태 창이 표시되면 가상 데이터를 확인하거나 추가 데이터를 가상화하도록 선택할 수 있습니다.

다음에 수행할 작업

  • 테이블 구조 및 메타데이터를 봅니다.
  • 테이블에 대한 액세스를 관리합니다.
  • 가상화에 대한 정확한 데이터를 준비할 수 있도록 열 이름 및 오브젝트 스토리지 자산의 유형을 편집하십시오.
  • 가상화된 테이블에 대한 통계를 수집하여 쿼리 성능을 최적화합니다. 자세한 정보는 Data Virtualization에서 통계 수집을 참조하십시오.
  • 선택적으로 가상화된 데이터 페이지에서 가상 오브젝트를 카탈로그에 공개하십시오. 더 자세한 정보는 Data Virtualization 의 카탈로그에 가상 데이터 게시하기를 참고하세요.