0 / 0
영어 버전 문서로 돌아가기
Data Virtualization 문자 인코딩 체계 설정하기
마지막 업데이트 날짜: 2024년 11월 26일
' Data Virtualization '에서 ' IBM Cloud Pak for Data'에 대한 문자 인코딩 체계 설정하기

원격 커넥터가 파일 데이터를 올바르게 디코딩하도록 하려면 문자 인코딩 체계를 수동으로 설정해야 합니다. 문자 인코딩 체계를 설정하여 읽기 데이터 파일에 특정 디코딩을 적용하도록 원격 커넥터를 구성합니다.

이 태스크에 대한 정보

Cloud Pak for Data은(는) 플랫 데이터 파일의 인코딩 스킴을 자동으로 발견합니다(예: CSV 및 TSV 파일). 그러나 인코딩 체계를 플랫 데이터 파일에 대해 수동으로 설정하여 디코딩 문제를 방지해야 합니다.

이러한 지시사항은 시프트-JS (일본어) 에 인코드된 데이터가 있는 파일을 예제로 사용합니다. 데이터 인코딩의 전체 목록을 가져오려면 지원되는 인코딩의 내용을 참조하십시오.

참고:
  • 원격 커넥터가 실행 중인 동안 다음 단계를 수행할 수 있습니다. 그러나 기존 가상 테이블에 새 인코딩 스킴을 적용하려면 가상 테이블을 삭제하고 이를 다시 가상화해야 합니다.
  • 특성 파일은 데이터 파일과 별도로 원격 커넥터 설치 디렉토리의 특수 폴더에 있습니다. Data Virtualization 원격 커넥터는 사용자 환경에 대한 중단을 최소화하면서 독립적으로 유지되며, 원격 커넥터의 ' Docker 설치가 제공하는 컨테이너화 원칙과 이점을 따릅니다.

프로시저

원격 커넥터가 파일의 데이터를 올바르게 디코드하도록 하려면 다음 방법 중 하나를 선택하십시오.

  • 이 호스트의 모든 데이터 파일에 대한 글로벌 기본 인코딩 체계를 설정합니다.
    1. Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 파일을 찾으십시오.
      Connector_install_directory를 원격 커넥터를 설치한 디렉토리로 바꾸십시오.
    2. FileImportDefaults.properties 파일을 편집하여 다음 특성을 추가하십시오.
      DataCodeset=windows-932

      이 특성을 설정하여 데이터 파일을 읽기 위해 Shift-JS 디코딩을 적용하도록 원격 커넥터를 구성한다.

  • 이 호스트의 경로에 있는 폴더의 특정 계층 구조에 있는 모든 데이터 파일에 대해 FileImportDefaults.properties 파일의 인코딩 설정을 대체합니다.
    이 지시사항은 /path/to/hierarchy 경로 아래의 폴더 계층 구조를 예로 사용합니다.
    1. Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 파일을 찾으십시오.
      Connector_install_directory를 원격 커넥터를 설치한 디렉토리로 바꾸십시오.
    2. FileImportDefaults.properties 파일을 새 위치에 복사하십시오.
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
    3. 새 위치에서 FileImportDefaults.properties 파일을 편집하여 다음 특성을 추가하십시오.
      DataCodeset=windows-932
      이 특성을 설정하여 /path/to/hierarchy 경로의 폴더 계층 구조 아래 모든 파일을 읽기 위해 Shift-JS 디코딩을 적용하도록 원격 커넥터를 구성합니다.
      참고: Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy아래 폴더의 계층 구조에서 서로 다른 깊이에 여러 특성 파일이 있는 경우, 실제 데이터 파일 경로에 가장 근접하게 일치하는 하위 경로가 있는 파일이 우선합니다.
  • 이 호스트의 경로 아래에 있는 폴더의 특정 계층 구조에서 특정 이름을 가진 모든 파일의 인코딩 설정을 대체합니다.
    이 지시사항은 /path/to/hierarchy 경로 아래의 폴더 계층 구조 및 datafile.csv 파일 이름을 예제로 사용합니다.
    1. Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 파일을 찾으십시오.
      Connector_install_directory를 원격 커넥터를 설치한 디렉토리로 바꾸십시오.
    2. FileImportDefaults.properties 파일을 새 위치에 복사하십시오. 파일 이름을 datafile.csv로 변경하십시오.
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
    3. 새 위치에서 datafile.csv.properties 파일을 편집하여 다음 특성을 추가하십시오.
      DataCodeset=windows-932
      이 특성을 설정하여 Shift-JS 디코딩을 적용하여 datafile.csv 경로의 폴더 계층 구조 아래에 있는 /path/to/hierarchy 파일을 모두 읽도록 원격 커넥터를 구성합니다.
      참고: Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy아래 폴더의 계층 구조에서 서로 다른 깊이에 여러 특성 파일이 있는 경우, 실제 데이터 파일 경로에 가장 근접하게 일치하는 하위 경로가 있는 파일이 우선합니다.
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기