0 / 0
Retourner à la version anglaise de la documentation
Définition du schéma d'encodage des caractères dans la Data Virtualization
Dernière mise à jour : 26 nov. 2024
Définition du schéma de codage des caractères dans la Data Virtualization pour IBM Cloud Pak for Data

Pour vous assurer que les connecteurs distants décodent correctement les données de fichier, vous devez définir manuellement le schéma de codage de caractères. En définissant le schéma de codage de caractères, vous configurez le connecteur distant pour appliquer un décodage spécifique pour lire les fichiers de données.

A propos de cette tâche

Cloud Pak for Data détecte automatiquement le schéma de codage des fichiers de données à plat, tels que les fichiers CSV et TSV. Cependant, vous devez définir le schéma de codage manuellement pour les fichiers de données à plat afin d'éviter les problèmes de décodage.

Ces instructions utilisent des fichiers avec des données codées en Maj-JS (japonais) comme exemple. Pour obtenir une liste complète des codages de données, voir Codages pris en charge.

Remarque :
  • Vous pouvez suivre ces étapes pendant l'exécution du connecteur distant. Toutefois, pour appliquer de nouveaux schémas de codage à une table virtuelle existante, vous devez supprimer la table virtuelle et la virtualiser à nouveau.
  • Les fichiers de propriétés se trouvent dans un dossier spécial du répertoire d'installation du connecteur distant, séparé de vos fichiers de données. Le connecteur distant de Data Virtualization reste autonome et perturbe le moins possible votre propre environnement, qui suit également les principes de conteneurisation et les avantages offerts par l'installation " Docker des connecteurs distants.

Procédure

Pour vous assurer que les connecteurs distants décodent correctement les données dans les fichiers, choisissez l'une des méthodes suivantes :

  • Définissez le schéma de codage par défaut global pour tous les fichiers de données sur cet hôte.
    1. Recherchez le fichier Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
      Remplacez Connector_install_directory par le répertoire dans lequel vous avez installé le connecteur distant.
    2. Editez le fichier FileImportDefaults.properties pour ajouter la propriété suivante:
      DataCodeset=windows-932

      En définissant cette propriété, vous configurez le connecteur distant pour appliquer le décodage Maj-JS afin de lire les fichiers de données.

  • Remplacer les paramètres de codage du fichier FileImportDefaults.properties pour tous les fichiers de données d'une hiérarchie spécifique de dossiers sous un chemin d'accès sur cet hôte.
    Ces instructions utilisent la hiérarchie des dossiers sous le chemin /path/to/hierarchy comme exemple.
    1. Recherchez le fichier Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
      Remplacez Connector_install_directory par le répertoire dans lequel vous avez installé le connecteur distant.
    2. Copiez le fichier FileImportDefaults.properties dans le nouvel emplacement:
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/FileImportDefaults.properties
    3. Editez le fichier FileImportDefaults.properties dans le nouvel emplacement pour ajouter la propriété suivante:
      DataCodeset=windows-932
      En définissant cette propriété, vous configurez le connecteur distant pour appliquer le décodage Shift-JS pour lire tous les fichiers sous la hiérarchie des dossiers dans le chemin /path/to/hierarchy.
      Remarque: dans les cas où vous disposez de plusieurs fichiers de propriétés à des profondeurs différentes dans la hiérarchie des dossiers sous Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, celui qui possède le sous-chemin correspondant le plus proche du chemin d'accès au fichier de données réel est prioritaire.
  • Remplacer les paramètres de codage de tous les fichiers portant un nom spécifique dans une hiérarchie spécifique de dossiers sous un chemin d'accès sur cet hôte.
    Ces instructions utilisent la hiérarchie des dossiers sous le chemin /path/to/hierarchy et le nom du fichier datafile.csv comme exemples.
    1. Recherchez le fichier Connector_install_directory/sysroot/data/FileImportControls/FileImportDefaults.properties .
      Remplacez Connector_install_directory par le répertoire dans lequel vous avez installé le connecteur distant.
    2. Copiez le fichier FileImportDefaults.properties dans le nouvel emplacement. Remplacez le nom de fichier par datafile.csv:
      Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy/datafile.csv.properties
    3. Editez le fichier datafile.csv.properties dans le nouvel emplacement pour ajouter la propriété suivante:
      DataCodeset=windows-932
      En définissant cette propriété, vous configurez le connecteur distant pour appliquer le décodage Shift-JS pour lire tous les fichiers nommés datafile.csv sous la hiérarchie des dossiers dans le chemin /path/to/hierarchy.
      Remarque: dans les cas où vous disposez de plusieurs fichiers de propriétés à des profondeurs différentes dans la hiérarchie des dossiers sous Connector_install_directory/sysroot/data/FileImportControls/path/to/hierarchy, celui qui possède le sous-chemin correspondant le plus proche du chemin d'accès au fichier de données réel est prioritaire.
Recherche et réponse à l'IA générative
Ces réponses sont générées par un modèle de langue de grande taille dans watsonx.ai en fonction du contenu de la documentation du produit. En savoir plus