0 / 0

Environnements DataStage

Dernière mise à jour : 06 mai 2025
Environnements DataStage

Contrôlez la façon dont vos travaux DataStage s'exécutent sur le moteur d'exécution en configurant des environnements. Vous pouvez exécuter des travaux DataStage dans des environnements IBM Cloud ou exécuter des travaux localement en configurant des environnements avec vos propres moteurs d'exécution distants DataStage .

DataStage sur IBM Cloud

IBM® DataStage® offre trois environnements PX que vous pouvez utiliser pour exécuter vos travaux. Un travail utilise par défaut Default DataStage PX S runtime. Toutefois, avant d'exécuter le flux en tant que travail, vous pouvez mettre à jour l'environnement vers l'un des trois environnements disponibles.

Les trois environnements d'exécution d' IBM Cloud consomment des heures d'unité de capacité (CUH) qui sont suivies. Seul le temps nécessaire à l'exécution des travaux est suivi. La création, la configuration et la mise à jour des flux sur le canevas DataStage n'utilisent pas de CUH.

Lorsque vous créez un travail dans lequel exécuter un flux DataStage , vous pouvez sélectionner l'un des environnements prédéfinis suivants:

Nom Configuration matérielle
Default DataStage PX S 1 conducteur : 2 vCPU et 8 Go de RAM
Default DataStage PX M 1 conducteur : 4 vCPU et 16 Go de RAM
Default DataStage PX L 1 conducteur : 8 vCPU et 32 Go de RAM

L'environnement d'exécution DataStage PX S par défaut est utilisé lorsque vous exécutez un travail d'extraction, de transformation et de chargement de données dans DataStage, à moins que vous ne sélectionniez un environnement différent. Pour les travaux complexes avec des ensembles de données volumineux, sélectionnez des plans avec plus de vCPU et de mémoire pour augmenter la capacité. Les environnements par défaut utilisent 2 partitions.

Pour indiquer un autre environnement à utiliser :

  • Sur le canevas DataStage , sélectionnez l'icône des paramètres d'exécution et l'environnement que vous souhaitez utiliser.
  • Sélectionnez un travail, éditez sa configuration et, dans l'onglet des paramètres d'exécution, changez l'environnement.
Les administrateurs peuvent créer de nouveaux environnements pour IBM Cloud afin de spécifier des variables d'environnement et de modifier le nombre de partitions.
Note : Différents environnements DataStage peuvent avoir le même nom car chaque environnement reçoit un uuid unique.

Environnements DataStage sur des moteurs d'exécution distants

Vous pouvez exécuter des travaux dans un environnement qui n'est pas géré par IBM à l'aide d'un moteur d'exécution distant. Avec un moteur d'exécution distant DataStage , vous pouvez utiliser des applications et des bases de données sur site et exécuter des travaux localement. Un administrateur peut configurer des moteurs d'exécution distants DataStage au niveau du projet. Les développeurs disposant d'un accès Editeur ou Administrateur à un projet avec un moteur d'exécution distant DataStage peuvent exécuter des travaux dans cet environnement.

Une fois que vous avez sélectionné un environnement distant comme environnement par défaut de projet, vous ne pouvez utiliser que des environnements distants dans ce projet. Vous ne pouvez pas revenir à l'utilisation d'environnements IBM Cloud pour les travaux DataStage de ce projet.

Les environnements distants offrent les avantages suivants:
  • Exécuter les charges de travail et traiter les données localement
  • Evitez les coûts de transfert de données
  • Augmentez la sécurité en conservant les données locales dans votre environnement de cloud
  • Utilisez les fonctions DataStage de Cloud Pak for Data telles que les étapes définies par l'utilisateur, l'étape Java Integration, les routines de travail avant / après, etc., sans avoir à effectuer une installation complète de Cloud Pak for Data

Les environnements distants ne prennent pas en charge les connecteurs qui nécessitent un téléchargement de pilote, les coffres et le connecteur de service de données. Plusieurs connecteurs sont pris en charge uniquement via une connexion de flux.

Pour plus d'informations, voir DataStage Anywhere.

Exécution d'un flux

Vous pouvez créer un travail dans lequel exécuter votre flux DataStage :

  • Directement sur le canevas DataStage en cliquant sur l'icône d'exécution dans la barre d'outils DataStage (le nom par défaut d'un travail qui exécute un flux est le nom du flux ajouté à .DataStage job
  • Dans la page FluxDataStage de votre projet , sélectionnez le flux DataStage , cliquez sur le menu Action et sélectionnez Nouveau travail.

Lorsque vous exécutez un travail d'extraction, de transformation ou de chargement de données dans DataStage, un " Default DataStage XS runtime est démarré automatiquement et est répertorié en tant qu'exécution active dans la page Environnements de votre projet. Vous pouvez mettre à jour l'environnement que vous souhaitez utiliser en sélectionnant l'icône des paramètres d'exécution sur la grille DataStage ou en sélectionnant un travail dans l'onglet Travaux et en modifiant les paramètres à cet endroit.

Surveillance de la facturation mensuelle

Vous devez être propriétaire ou administrateur d'un compte IBM Cloud pour afficher les informations d'utilisation des ressources.

Pour afficher les frais mensuels, la quantité de CUH utilisée, le nombre de VPC utilisés et le nombre d'utilisateurs pour votre instance de service, accédez au tableau de bord d'utilisation du cloud. Pour chaque instance, cliquez sur Gérer > Facturation et utilisation > Utilisation, cliquez sur Afficher les instances en regard du nom de service, puis sur Afficher l'instance en regard du nom de l'instance.

Journaux d'exécution pour des travaux

Pour afficher les journaux cumulés d'un travail DataStage :

  1. Dans la page Travaux du projet, cliquez sur le travail DataStage dont vous souhaitez afficher les journaux.
  2. Cliquez sur l'exécution de travail. Vous pouvez afficher l'historique du travail, copier le journal dans le presse-papiers ou télécharger le journal.