0 / 0
Go back to the English version of the documentation
在Data Virtualization中设置字符编码方案
Last updated: 2024年11月26日
在IBM Cloud Pak for Data的Data Virtualization中设置字符编码方案

要确保远程连接器正确解码文件数据,必须手动设置字符编码方案。 通过设置字符编码方案,可以配置远程连接器以应用特定解码来读取数据文件。

关于本任务

Cloud Pak for Data 会自动检测平面数据文件 (例如 CSV 和 TSV 文件) 的编码方案。 但是,您必须为平面数据文件手动设置编码方案,以避免解码问题。

这些指示信息使用包含以 Shift-JS(日语)编码的数据的文件作为示例。 要获取数据编码的完整列表,请参阅 支持的编码

注:
  • 当远程连接器正在运行时,您可以遵循这些步骤。 但是,要对现有虚拟表应用新的编码方案,必须删除虚拟表并再次对其进行虚拟化。
  • 属性文件位于远程连接器安装目录中的特殊文件夹下,与数据文件分开。 Data Virtualization远程连接器仍然是独立的,对您自己的环境干扰最小,这也遵循了远程连接器 "Docker安装所提供的容器化原则和优势。

过程

要确保远程连接器正确解码文件中的数据,请选择以下某种方法:

  • 设置此主机上所有数据文件的全局缺省编码方案。
    1. 查找 Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 文件。
      Connector_install_directory 替换为安装了远程连接器的目录。
    2. 编辑 FileImportDefaults.properties 文件以添加以下属性:
      DataCodeset=windows-932

      通过设置此属性,可配置远程连接器以应用 Shift-JS 解码来读取数据文件。

  • 覆盖此主机上路径下特定文件夹层次结构中所有数据文件的 FileImportDefaults.properties 文件中的编码设置。
    这些指示信息使用 /path/to/hierarchy 路径下的文件夹层次结构作为示例。
    1. 查找 Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 文件。
      Connector_install_directory 替换为安装了远程连接器的目录。
    2. FileImportDefaults.properties 文件复制到新位置:
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
    3. 编辑新位置中的 FileImportDefaults.properties 文件以添加以下属性:
      DataCodeset=windows-932
      通过设置此属性,可以配置远程连接器以应用 Shift-JS 解码来读取 /path/to/hierarchy 路径中文件夹层次结构下的所有文件。
      注: 如果您在 Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy下的文件夹层次结构中的不同深度有多个属性文件,那么具有与实际数据文件路径最匹配的子路径的属性文件优先。
  • 覆盖此主机上路径下的特定文件夹层次结构中具有特定名称的所有文件的编码设置。
    这些指示信息使用 /path/to/hierarchy 路径下的文件夹层次结构以及 datafile.csv 文件名作为示例。
    1. 查找 Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties 文件。
      Connector_install_directory 替换为安装了远程连接器的目录。
    2. FileImportDefaults.properties 文件复制到新位置。 将文件名更改为 datafile.csv:
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
    3. 编辑新位置中的 datafile.csv.properties 文件以添加以下属性:
      DataCodeset=windows-932
      通过设置此属性,可以配置远程连接器以应用 Shift-JS 解码来读取 /path/to/hierarchy 路径中文件夹层次结构下名为 datafile.csv 的所有文件。
      注: 如果您在 Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy下的文件夹层次结构中的不同深度有多个属性文件,那么具有与实际数据文件路径最匹配的子路径的属性文件优先。
Generative AI search and answer
These answers are generated by a large language model in watsonx.ai based on content from the product documentation. Learn more