0 / 0

Gestion des variables d'environnement dans DataStage

Dernière mise à jour : 12 mars 2025
Gestion des variables d'environnement dans DataStage

Vous pouvez gérer les variables d'environnement pour IBM® DataStage® de différentes manières.

Dans DataStage, vous pouvez gérer les variables d'environnement de trois manières différentes : au niveau du projet, au niveau du flux et en utilisant l'interface de ligne de commande (CLI) dsjob.

Niveau de projet

Pour configurer des variables d'environnement à partir du niveau du projet, procédez comme suit:
  1. Ouvrez un projet, puis cliquez sur l'onglet Gérer .
  2. Cliquez sur Environnements > Modèles > Nouveau modèle + ou éditez un modèle existant en l'ouvrant, en cliquant sur Nouvelle variable d'environnement + et en ajoutant une paire clé-valeur.
  3. Spécifiez les détails et la configuration de l'environnement.
  4. Dans la zone Variables d'environnement , spécifiez les variables d'environnement d'exécution à l'aide d'une paire nom-valeur.
    Par exemple :
    CC_MSG_LEVEL=1
    APT_CONFIG_FILE=/ds-storage/2nodes.apt
  5. Cliquez sur Créer.
  6. A partir d'un flux DataStage , cliquez sur l'icône Paramètres dans la barre d'outils, puis sur Exécuter dans la page Paramètres .
  7. Sélectionnez l'environnement que vous avez créé, puis cliquez sur Sauvegarder.

Niveau de flux DataStage

Pour sélectionner des variables d'environnement à partir du niveau de flux, procédez comme suit:
  1. Ouvrez un flux DataStage .
  2. Cliquez sur l'icône Ajouter des paramètres ({#}) dans la barre d'outils.
  3. Sélectionnez une ou plusieurs variables d'environnement dans la liste des variables d'environnement disponibles.
  4. Cliquez sur Ajouter, puis sur Revenir au canevas.

interface de ligne de commande (CLI)

Vous pouvez transmettre des variables d'environnement à partir de l'interface de ligne de commande. Prenons cet exemple :
cpdctl dsjob run --job "TestSimpleJavaWriteJSON.DataStage job" --project Project2021 --wait 300 --param FILE_NAME=/ds-storage/output/MySales5k.json --env "\$CC_MSG_LEVEL"="1"

Pour plus d'informations, voir Outils de ligne de commandeDataStage.

Substituer les règles

Les règles de substitution suivantes s'appliquent aux variables d'environnement:
  • Les variables d'environnement de l'interface de ligne de commande dsjob écrasent les variables d'environnement de niveau de flux DataStage .
  • Les variables d'environnement de niveau flux DataStage remplacent les variables d'environnement de niveau environnement d'exécution.

Variables d'environnement définies par défaut

La liste suivante contient les variables d'environnement définies par défaut.

APT_OLD_BOUNDED_LENGTH
  • Cloud Pak for Data paramètre : APT_OLD_BOUNDED_LENGHT = true
  • Cloud Pak for Data comportement : La façon dont PX gère en interne les chaînes de longueur limitée et les champs bruts a été modifiée, les champs étant désormais traités comme des champs de longueur fixe et non plus variable. Cette mesure a été prise pour améliorer les performances du traitement des enregistrements. La valeur "true" permet de lire les données écrites dans l'ancien format de longueur variable.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_OLD_BOUNDED_LENGTH = false
  • Comportement avec le réglage traditionnel (11.7) : Les ensembles de données écrits dans l'ancien format de longueur variable ne peuvent pas être lus.
APT_THREAD_SAFE_FAST_ALLOC
  • Cloud Pak for Data paramètre : APT_THREAD_SAFE_FAST_ALLOC = threadsafe
  • Cloud Pak for Data comportement : La chaîne de valeurs spécifie le mode de threading pour les allocateurs rapides, qui sont utilisés pour allouer des objets couramment utilisés tels que les chaînes de caractères : "threadsafe". Les instances d'allocateurs rapides seront conservées dans un espace de stockage spécifique aux threads.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_ THREAD_SAFE_FAST_ALLOC = legacy (ou) false
  • Comportement avec la configuration traditionnelle (11.7) : Les instances de l'allocateur rapide sont partagées entre les threads.
APT_DONT_ALLOW_DOUBLE_TSORT_COMBINE
  • Cloud Pak for Data paramètre : APT_DONT_ALLOW_DOUBLE_TSORT_COMBINE = true
  • Cloud Pak for Data comportement : Par défaut, le contrôleur d'opérateur combiné fusionne autant d'opérateurs tsort que possible. Il est défini comme vrai afin que l'opérateur combiné ne fusionne pas plus d'un opérateur de tri si l'opérateur combiné est suivi d'une étape de jonction en aval. Cette disposition a été ajoutée afin d'éviter de bloquer les scénarios impliquant des étapes de jonction entre les ports.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_ DONT_ALLOW_DOUBLE_TSORT_COMBINE = false
  • Comportement avec le paramètre Traditionnel (11.7) : Le contrôleur d'opérateur combiné combine autant d'opérateurs de tri que possible.
APT_SCRATCH_RESERVE_MB
  • Cloud Pak for Data paramètre : APT_SCRATCH_RESERVE_MB = 10
  • Cloud Pak for Data comportement : Les opérateurs tels que le tri ou la mise en mémoire tampon utilisent le disque scratch. Si un minimum d'espace libre est disponible sur le disque scratch, celui-ci est utilisé pour créer des fichiers scratch. Si l'espace libre est inférieur au nombre minimum de Mo, le disque scratch suivant, qui répond aux critères d'espace libre minimum, est utilisé. Il est appliqué lorsque plusieurs disques scratch sont définis dans APT_CONFIG_FILE.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_SCRATCH_RESERVE_MB = false
  • Comportement avec le paramètre Traditionnel (11.7) : L'espace de réserve par défaut de 2GB est utilisé.
APT_DISABLE_JOBMON_SCHEMA_STRING
  • Cloud Pak for Data paramètre : APT_DISABLE_JOBMON_SCHEMA_STRING = true
  • Cloud Pak for Data comportement : Désactive l'envoi d'informations de schéma dans les messages linkstats au moniteur de tâches.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_DISABLE_JOBMON_SCHEMA_STRING = false
  • Comportement avec le paramètre Traditionnel (11.7) : Envoie des informations sur le schéma dans les statistiques de liens. Actuellement, Cloud Pak for Data ne traite pas les chaînes de schéma provenant de linkstats. Les informations de schéma peuvent être désactivées.
APT_DS_COMPRESSION
  • Cloud Pak for Data paramètre : APT_DS_COMPRESSION = true
  • Cloud Pak for Data comportement : La variable active la compression pour les ensembles de données.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_DS_COMPRESSION = false
  • Comportement avec le réglage traditionnel (11.7) : Les ensembles de données ne sont pas compressés.
APT_IMPORT_FORCE_QUOTE_DELIM
  • Cloud Pak for Data paramètre : APT_IMPORT_FORCE_QUOTE_DELIM = true
  • Cloud Pak for Data comportement : Par défaut, l'importation de champs entre guillemets recherche un guillemet ouvrant et un guillemet fermant. Si les données du champ contiennent le caractère de guillemet, ce caractère est considéré à tort comme le caractère de guillemet fermant. La définition de cette variable d'environnement fait que l'importation ne reconnaît que les guillemets fermants suivis du caractère délimiteur du champ. Cette modification permet au champ de contenir des caractères de citation intégrés et d'être importé correctement.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_IMPORT_FORCE_QUOTE_DELIM = false
  • Comportement avec le paramètre Traditionnel (11.7) : L'importation de champs contenant des caractères de guillemets n'importe pas l'enregistrement. Par défaut, un avertissement est émis et les enregistrements sont rejetés.
APT_TSORT_SCRATCH_COMPRESSION
  • Cloud Pak for Data paramètre : APT_TSORT_SCRATCH_COMPRESSION = true
  • Cloud Pak for Data comportement : les fichiers scratch de Tsort sont écrits sur le disque en mode compressé pour économiser de l'espace.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_TSORT_SCRATCH_COMPRESSION = false
  • Comportement avec le paramètre Traditionnel (11.7) : les fichiers scratch de Tsort sont écrits sur le disque sans compression.
APT_DOWNGRADED_MESSAGES
  • Cloud Pak for Data paramètre : APT_DOWNGRADED_MESSAGES = "Ramassé JAVA_TOOL_OPTIONS :"
  • Cloud Pak for Data comportement : Convertit la gravité des messages d'erreur ou d'avertissement de l'orchestration de sortie en Informational pour le message avec la chaîne "Picked up JAVA_TOOL_OPTIONS :".
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_DOWNGRADED_MESSAGES = false
  • Comportement avec le paramètre Traditionnel (11.7) : Aucun message n'est déclassé. Toutefois, l'utilisateur peut remplacer ces valeurs par d'autres. Le format de cette variable est une liste de messages d'erreur ou d'avertissement complets ou partiels dont la gravité doit être transformée en information sans partie horodatée. Chaque message est séparé par une chaîne unique - #?#.
  • Exemple : APT_DOWNGRADED_MESSAGES = READ n'est pas pris en charge dans l'état standby#?#IPv6 n'est pas actuellement pris en charge.
APT_IMPEXP_INFER_EOL_RECORD_DELIM
  • Cloud Pak for Data paramètre : APT_IMPEXP_INFER_EOL_RECORD_DELIM = true
  • Cloud Pak for Data comportement : la couche d'importation de fichiers séquentiels recherche les délimiteurs d'enregistrement EOL de Windows lorsque les délimiteurs d'enregistrement EOL d'Unix sont définis, et permet au fichier d'être importé correctement.
  • Traditionnel (11.7) paramètre de comportement par défaut : APT_IMPEXP_INFER_EOL_RECORD_DELIM = false
  • Comportement avec la configuration traditionnelle (11.7) : la couche d'importation de fichiers séquentiels recherche uniquement le délimiteur d'enregistrement EOL défini dans les propriétés d'importation.