Per assicurarsi che i connettori remoti decodificino correttamente i dati del file, è necessario impostare lo schema di codifica caratteri manualmente. Impostando lo schema di codifica caratteri, si configura il connettore remoto per applicare la decodifica specifica per leggere i file di dati.
Informazioni su questa attività
Cloud Pak for Data rileva automaticamente lo schema di codifica dei file di dati flat, come i file CSV e TSV. Tuttavia, è necessario impostare lo schema di codifica manualmente per i file di dati flat per evitare problemi di decodifica.
Queste istruzioni utilizzano i file con dati codificati in Shift - JS (giapponese) come esempio. Per un elenco completo delle codifiche dei dati, consultare Encoding supportate.
Nota:
- È possibile seguire questi passi mentre il connettore remoto è in esecuzione. Tuttavia, per applicare nuovi schemi di codificazione a una tabella virtuale esistente, è necessario eliminare la tabella virtuale e virtualizzare nuovamente.
- I file delle proprietà si trovano in una cartella speciale nella directory di installazione del connettore remoto, separata dai file di dati. Il connettore remoto di Data Virtualization rimane autonomo, con un'interruzione minima del proprio ambiente, che segue anche i principi di containerizzazione e i vantaggi offerti dall'installazione " Docker dei connettori remoti.
Procedura
Per garantire che i connettori remoti decodifichino correttamente i dati nei file, scegliere uno dei seguenti metodi:
- Impostare lo schema di codifica predefinito globale per tutti i file di dati su questo host.
- Trovare il file Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sostituire Connector_install_directory con la directory in cui è stato installato il connettore remoto.
- Modificare il file FileImportDefaults.properties per aggiungere la seguente proprietà:
DataCodeset=windows-932
Impostando questa proprietà, si configura il connettore remoto per applicare la decodifica Shift - JS per leggere i file di dati.
- Sovrascrivere le impostazioni di codifica dal file FileImportDefaults.properties per tutti i file di dati in una gerarchia specifica di cartelle in un percorso su questo host
Queste istruzioni utilizzano la gerarchia delle cartelle nel percorso /path/to/hierarchy come esempio.
- Trovare il file Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sostituire Connector_install_directory con la directory in cui è stato installato il connettore remoto.
- Copiare il file FileImportDefaults.properties nella nuova posizione:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
- Modificare il file FileImportDefaults.properties nella nuova ubicazione per aggiungere la seguente proprietà:
DataCodeset=windows-932
Impostando questa proprietà, si configura il connettore remoto per applicare la decodifica Shift - JS per leggere tutti i file nella gerarchia delle cartelle nel percorso
/path/to/hierarchy .
Nota: nei casi in cui si dispone di diversi file delle proprietà a diverse profondità nella gerarchia delle cartelle in Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, quello con il percorso secondario corrispondente più vicino al percorso del file di dati effettivo ha la precedenza.
- Sovrascrivere le impostazioni di codifica per tutti i file con uno specifico nome in una specifica gerarchia di cartelle in un percorso su questo host
Queste istruzioni utilizzano la gerarchia di cartelle nel percorso /path/to/hierarchy e il nome file datafile.csv come esempi.
- Trovare il file Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
Sostituire Connector_install_directory con la directory in cui è stato installato il connettore remoto.
- Copiare il file FileImportDefaults.properties nella nuova posizione. Modificare il nome file in datafile.csv:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
- Modificare il file datafile.csv.properties nella nuova ubicazione per aggiungere la seguente proprietà:
DataCodeset=windows-932
Impostando questa proprietà, si configura il connettore remoto per applicare la decodifica Shift - JS per leggere tutti i file denominati
datafile.csv nella gerarchia delle cartelle nel percorso
/path/to/hierarchy .
Nota: nei casi in cui si dispone di diversi file delle proprietà a diverse profondità nella gerarchia delle cartelle in Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, quello con il percorso secondario corrispondente più vicino al percorso del file di dati effettivo ha la precedenza.