Para asegurarse de que los conectores remotos decodifiquen correctamente los datos de archivos, debe establecer el esquema de codificación de caracteres manualmente. Cuando establece el esquema de codificación de caracteres, debe configurar el conector remoto para que aplique una decodificación específica para leer los archivos de datos.
Acerca de esta tarea
Cloud Pak for Data detecta automáticamente el esquema de codificación de archivos de datos sin formato, como archivos CSV y TSV. Sin embargo, debe establecer manualmente el esquema de codificación para archivos de datos planos para evitar problemas de descodificación.
Estas instrucciones utilizan archivos con datos codificados en Shift-JS (Japonés) como ejemplo. Para obtener una lista completa de codificaciones de datos, consulte Codificaciones soportadas.
Nota:
- Puede seguir estos pasos mientras el conector remoto se está ejecutando. No obstante, para aplicar los nuevos esquemas de codificación a una tabla virtual existente, debe suprimir la tabla virtual y virtualizarla de nuevo.
- Los archivos de propiedades se encuentran bajo una carpeta especial en el directorio de instalación del conector remoto, separados de los archivos de datos. El conector remoto Data Virtualization permanece autónomo con una mínima interrupción de su propio entorno, que también sigue los principios de contenedorización y los beneficios que proporciona la instalación ' Docker de conectores remotos.
Procedimiento
Para asegurarse de que los conectores remotos decodifiquen correctamente los datos de los archivos, seleccione uno de los métodos siguientes:
- Establezca el esquema de codificación predeterminado global para todos los archivos de datos de este host.
- Busque el archivo Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sustituya Connector_install_directory por el directorio donde ha instalado el conector remoto.
- Edite el archivo FileImportDefaults.properties para añadir la propiedad siguiente:
DataCodeset=windows-932
Si establece esta propiedad configura el conector remoto para que aplique la codificación Shift-JS para leer archivos de datos.
- Alterar temporalmente los valores de codificación del archivo FileImportDefaults.properties para todos los archivos de datos de una jerarquía específica de carpetas bajo una vía de acceso en este host.
Estas instrucciones utilizan la jerarquía de carpetas debajo la vía de acceso /path/to/hierarchycomo ejemplo.
- Busque el archivo Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sustituya Connector_install_directory por el directorio donde ha instalado el conector remoto.
- Copie el archivo FileImportDefaults.properties en la nueva ubicación:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
- Edite el archivo FileImportDefaults.properties en la nueva ubicación para añadir la propiedad siguiente:
DataCodeset=windows-932
Al establecer esta propiedad, se configura el conector remoto para que aplique la descodificación Shift-JS para leer todos los archivos debajo de la jerarquía de carpetas en la vía de acceso de acceso
/path/to/hierarchy.
Nota: En los casos en los que tenga varios archivos de propiedades a diferentes profundidades en la jerarquía de carpetas bajo Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, el que tenga la subvía de acceso coincidente más cercana a la vía de acceso del archivo de datos real tiene prioridad.
- Altere temporalmente los valores de codificación para todos los archivos con un nombre específico en una jerarquía específica de carpetas bajo una vía de acceso en este host.
Estas instrucciones utilizan la jerarquía de carpetas bajo la vía de acceso /path/to/hierarchy y el nombre de archivo datafile.csv como ejemplos.
- Busque el archivo Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sustituya Connector_install_directory por el directorio donde ha instalado el conector remoto.
- Copie el archivo FileImportDefaults.properties en la nueva ubicación. Cambie el nombre de archivo por datafile.csv:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
- Edite el archivo datafile.csv.properties en la nueva ubicación para añadir la propiedad siguiente:
DataCodeset=windows-932
Al establecer esta propiedad, se configura el conector remoto para que aplique la descodificación Shift-JS para leer todos los archivos denominados
datafile.csv bajo la jerarquía de carpetas en la vía de acceso
/path/to/hierarchy.
Nota: En los casos en los que tenga varios archivos de propiedades a diferentes profundidades en la jerarquía de carpetas bajo Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, el que tenga la subvía de acceso coincidente más cercana a la vía de acceso del archivo de datos real tiene prioridad.