Um sicherzustellen, dass ferne Connectors die Dateidaten korrekt decodieren, müssen Sie das Schema für die Umsetzung der Zeichencodierung manuell festlegen. Wenn Sie das Schema für die Umsetzung der Zeichencodierung festlegen, konfigurieren Sie denfernen Connector so, dass eine bestimmte Decodierung für das Lesen von Datendateien angewendet wird.
Informationen zu dieser Task
Cloud Pak for Data erkennt automatisch das Schema für Codeumsetzung von unstrukturierten Datendateien wie CSV-und TSV-Dateien. Sie müssen jedoch das Schema für Codeumsetzung für unstrukturierte Datendateien manuell festlegen, um Decodierungsprobleme zu vermeiden.
In den folgenden Anweisungen werden Dateien mit Daten verwendet, die in Shift-JS (Japanisch) codiert sind. Eine vollständige Liste der Datencodierungen finden Sie unter Unterstützte Codierungen.
Hinweis:
- Sie können die folgenden Schritte ausführen, während der ferne Connector ausgeführt wird. Wenn Sie jedoch neue Codierungsschemataauf eine vorhandene virtuelle Tabelle anwenden möchten, müssen Sie die virtuelle Tabelle löschen und die Tabelle neu virtualisieren.
- Die Eigenschaftendateien befinden sich getrennt von Ihren Datendateien in einem speziellen Ordner unter dem Installationsverzeichnis des fernen Connectors. Der Data Virtualization bleibt in sich geschlossen und beeinträchtigt Ihre eigene Umgebung nur minimal. Er folgt außerdem den Prinzipien der Containerisierung und den Vorteilen, die die " Docker -Installation von Remote-Connectors bietet.
Prozedur
Wählen Sie eine der folgenden Methoden aus, um sicherzustellen, dass ferne Connectors Daten in Dateien ordnungsgemäß decodieren:
- Legt das globale Standardcodierungsschema für alle Datendateien auf diesem Host fest.
- Suchen Sie die Datei Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
ErsetzenSie Connector-Installationsverzeichnis durch das Verzeichnis, in dem Sie den fernen Connector installiert haben.
- Bearbeiten Sie die Datei FileImportDefaults.properties , um die folgende Eigenschaft hinzuzufügen:
DataCodeset=windows-932
Wenn Sie diese Eigenschaft definieren, konfigurieren Sie denfernen Connector so, dass er beim Lesen von Datendateien die Shift-JS-Decodierung anwendet.
- Überschreiben Sie die Codierungseinstellungen aus der Datei FileImportDefaults.properties für alle Datendateien in einer bestimmten Ordnerhierarchie unter einem Pfad auf diesem Host.
In diesen Anweisungen wird die Hierarchie der Ordner unter dem Pfad /path/to/hierarchyals Beispiel verwendet.
- Suchen Sie die Datei Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
ErsetzenSie Connector-Installationsverzeichnis durch das Verzeichnis, in dem Sie den fernen Connector installiert haben.
- Kopieren Sie die Datei FileImportDefaults.properties an die neue Position:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
- Bearbeiten Sie die Datei FileImportDefaults.properties an der neuen Position, um die folgende Eigenschaft hinzuzufügen:
DataCodeset=windows-932
Durch das Festlegen dieser Eigenschaft konfigurieren Sie den fernen Connector so, dass die Shift-JS-Decodierung angewendet wird, um alle Dateien unter der Ordnerhierarchie im Pfad
/path/to/hierarchyzu lesen.
Hinweis: In Fällen, in denen mehrere Eigenschaftendateien in unterschiedlichen Tiefen in der Ordnerhierarchie unter Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchyvorhanden sind, hat die Datei mit dem Unterpfad, der dem tatsächlichen Datendateipfad am ehesten entspricht, Vorrang.
- Überschreiben Sie die Codierungseinstellungen für alle Dateien mit einem bestimmten Namen in einer bestimmten Ordnerhierarchie unter einem Pfad auf diesem Host.
In diesen Anweisungen wird die Hierarchie der Ordner unter dem Pfad /path/to/hierarchyund der Dateiname datafile.csvals Beispiele verwendet.
- Suchen Sie die Datei Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
ErsetzenSie Connector-Installationsverzeichnis durch das Verzeichnis, in dem Sie den fernen Connector installiert haben.
- Kopieren Sie die Datei FileImportDefaults.properties an die neue Position. Ändern Sie den Dateinamen in datafile.csv:
Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
- Bearbeiten Sie die Datei datafile.csv.properties an der neuen Position, um die folgende Eigenschaft hinzuzufügen:
DataCodeset=windows-932
Durch Festlegen dieser Eigenschaft konfigurieren Sie den fernen Connector so, dass er die Shift-JS-Decodierung anwendet, um alle Dateien mit dem Namen
datafile.csvunter der Ordnerhierarchie im Pfad
/path/to/hierarchyzu lesen.
Hinweis: In Fällen, in denen mehrere Eigenschaftendateien in unterschiedlichen Tiefen in der Ordnerhierarchie unter Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchyvorhanden sind, hat die Datei mit dem Unterpfad, der dem tatsächlichen Datendateipfad am ehesten entspricht, Vorrang.