Data Virtualization 에서는 오브젝트 스토리지에 파일로 저장된 데이터를 가상화하고 사용할 수 있습니다. 다음과 같은 객체 저장소의 파일에서 데이터를 가상화할 수 있습니다. 데이터 소스: 하나 이상의 파일에서 데이터를 분할하거나 결합하여 가상 테이블을 만듭니다.
이 태스크에 대한 정보
Data Virtualization' Cloud Object Storage '에서 가상화된 파일에 대한 개요는 다음 동영상을 참조하세요.
이 비디오는 이 문서에 있는 개념과 작업을 시각적으로 배울 수 있는 방법을 제공합니다.
프로시저
- 네비게이션 메뉴에서 " "를 클릭하면 서비스 메뉴가 나타납니다.
서비스 메뉴는 기본적으로 데이터 소스 페이지에 열립니다.
- 서비스 메뉴에서 클릭한 다음, 파일 탭을 클릭합니다.
사용 가능한 데이터 소스의 목록이 표시됩니다. 사용 가능한 필터를 사용하여 표시되는 자산의 범위를 좁힐 수 있습니다.
데이터 소스 연결을 설정할 때 버킷 이름을 지정한 경우, 개체 저장소 연결 세부사항을 확장하기 위해 [
]를 클릭하여 서비스 유형 과 버킷 정보를 확인합니다. 데이터 소스 연결 설정 시 버켓 이름을 지정하지 않은 경우 버켓 입력 필드를 사용하여 엔드포인트에서 특정 버켓을 찾을 수 있습니다.
데이터 소스 목록이 나타나지 않으면 새로 고침을 클릭하세요.
.
- 파일 및 파일 경로를 찾아보려는 오브젝트 스토리지 엔드포인트를 선택하십시오.
Cloud Object Storage의 경우, 엔드포인트는 오브젝트 스토리지의 URL입니다.
엔드포인트의 파일 경로 또는 버킷 목록이 표시됩니다. 파일 경로 구조를 탐색하거나, 파일 경로에서 첫 번째 파일의 내용에 대한 세부 정보를 보려면

를 클릭하십시오.
버켓을 카트에 추가할 수 없습니다. 카트에 파일 경로를 추가하려면 파일 경로를 선택하여 경로에서 파일을 미리보고 카트에 추가하기를 클릭해야 합니다. 버킷 레벨에서 파일을 선택할 수 없습니다. 파일을 버킷의 파일 경로에 추가해야 합니다.
- 가상화할 파일 또는 파일 경로를 선택하고 카트에 추가를 클릭하십시오.
중요:
- 다중 파일을 포함하는 파일 경로에서 단일 파일을 가상화할 수 없습니다. 이 URL은 파일이 위치하고 전체 파일 경로가 가상화되는 상위 경로로 해석됩니다. 단일 파일을 가상화하려는 경우 별도의 파일 경로로 이동할 수 있습니다. 별도의 파일 경로는 가상화되거나 가상화될 다른 파일 경로의 서브파일 경로가 아니어야 합니다.
- 가상화하려는 파일은 파일 경로 내에 있어야 하며 버킷과 동일한 레벨에 있지 않아야 합니다. 예를 들어, s3a://mynewbigsqlbucket/mydata.csv 파일을 가상화할 수 없습니다. 가상화 프로세스에서는 경로 없이 버킷 이름만 사용하여 외부 테이블을 작성할 수 없으므로 mydata.csv을(를) 파일 경로에 넣고 s3a://mynewbigsqlbucket/fi1epath1/mydata.csv을(를) 가상화해야 합니다.
- 파일 데이터 선택사항을 가상 파일로 미리보려면 카트 보기 를 클릭하십시오.
- 권장: 파티션된 컬럼의 유형을 문자열에서 더 적합한 내용으로 업데이트하십시오. 최적의 성능을 위해 컬럼을 파티셔닝하는 적절한 유형을 수동으로 검사하고 지정하십시오.
- 선택 사항:
를 클릭하고 열 편집을 선택합니다. 파티셔닝 열 로 태그 지정되지 않은 열 이름을 편집하고 드롭 다운 메뉴를 사용하여 열 유형을 변경할 수 있습니다. 편집 내용에 만족한 경우 적용을 클릭하십시오. 테이블을 가상화한 후에는 업데이트된 컬럼 이름이 표시됩니다.참고: IBM Cloud
Object Storage 에서 일본어 데이터가 있는 JSON 파일을 가상화하고 일본어 열 이름이 올바르게 표시되지 않으면
allownonalphanumeric
옵션을 사용하여 가상화된 일본어 열 헤더를 올바르게 볼 수 있습니다. 이 옵션은 기본적으로 사용 안함으로 설정되어 있으므로 사용으로 설정해야 합니다. 자세한 내용은
가상화된 데이터에 일본어 열 이름이 올바르게 표시되지 않음을 참조하십시오.
- 가상화된 테이블에 적합한 공유 옵션을 선택합니다.
- 선택한 카탈로그에도 공개하려면 카탈로그에 공개 를 선택하십시오.
사용 가능한 카탈로그의 목록이 드롭 다운 메뉴에 표시됩니다. 각 카탈로그는
통제되지 않음 또는
통제되지 않음으로 태그됩니다.
참고: IBM
Knowledge Catalog 에 카탈로그가 하나 이상 있어야 합니다.
카탈로그에 공개할 수 있는 권한이 있어야 합니다. 관리자는 모든 가상 오브젝트가 선택된 통제 카탈로그에 공개되는지 여부를 사용으로 설정하여 사용자가 지정된 카탈로그에 공개하지 못하도록 할 수 있습니다.
- 스키마 필드에 스키마를 지정하십시오.
다음 단계를 수행하여 스키마를 작성할 수도 있습니다.
- Data Virtualization 엔지니어 또는 사용자 역할이 있는 경우 스키마 필드를 기본값으로 두어 사용자 ID로 스키마를 만듭니다.
- Data Virtualization 관리자 역할이 있는 경우 스키마 필드를 기본값으로 두어 사용자 ID로 스키마를 만들거나 스키마 필드에 새 스키마 이름을 입력합니다.
- 가상화 를 클릭하여 프로세스를 완료하십시오.
상태 창이 표시되면 가상 데이터를 확인하거나 추가 데이터를 가상화하도록 선택할 수 있습니다.