0 / 0
Retourner à la version anglaise de la documentation

Modifier l'étape de capture dans DataStage

Dernière mise à jour : 12 mars 2025
Étape Change Capture dans DataStage

L'étape Change Capture est une étape de traitement qui compare deux fichiers et enregistre les différences.

L'étape Capturer la modification prend deux jeux de données d'entrée, l'un appelé antérieur et l'autre postérieur, et génère un jeu de données unique dont les enregistrements représentent les changements apportés dans le jeu de données antérieur afin d'obtenir le jeu de données postérieur. Elle génère un jeu de données de changement, dont la définition de table est transférée depuis la définition de table du jeu de données postérieur et complétée d'une colonne : un code de changement avec des valeurs codant les quatre actions (insertion, suppression, copie et édition). L'indicateur de conservation-partitionnement est défini sur l'ensemble de données de modification.

La comparaison repose sur un ensemble de colonnes de clé ; les lignes des deux jeux de données sont considérées comme des copies des unes et des autres si les valeurs dans ces colonnes de clé sont identiques. Si vous le souhaitez, vous pouvez également spécifier des valeurs de changement. Si deux lignes possèdent des colonnes de clé identiques, vous pouvez comparer les colonnes de valeurs sur les lignes pour déterminer si l'une est une copie éditée de l'autre.

L'étape suppose que les données entrantes sont partitionnées dans des clés et triées par ordre croissant. Les colonnes en fonction desquelles les données sont hachées doivent être les colonnes de clé utilisées pour la comparaison des données. Vous pouvez effectuer le tri et le partitionnement à l'aide de l'étape Trier ou en utilisant les fonctions de tri et de partitionnement intégrées de l'étape Capturer la modification.

Vous pouvez utiliser l'étape complémentaire d'application des modifications pour combiner les modifications de l'étape de capture des modifications avec l'ensemble de données antérieur original afin de reproduire l'ensemble de données postérieur (voir Étape de basculement dans DataStage).

L'étape de capture des changements est très similaire à l'étape de différence décrite dans L'étape de différence dans DataStage.

Lorsque vous cliquez deux fois sur l'étape, le panneau de propriétés s'ouvre. Le panneau de propriétés comporte trois onglets :

  • Étape. Elle est toujours présente et sert à indiquer des informations générales sur l'étape.
  • Entrée. Il s'agit de l'emplacement où vous spécifiez des détails sur le fichier dont les doublons sont supprimés.
  • Sortie. Page dans laquelle vous spécifiez les détails relatifs aux données traitées qui résultent de l'étape.

Onglet Entrée

L'onglet Colonnes indique les définitions de colonne des données entrantes. L'onglet Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien d'entrée.

Onglet Sortie

La section Colonnes indique les définitions de colonne des données. Cliquez sur Éditer dans la section Colonnes pour ouvrir l'éditeur de colonne. La carte de la section de colonne d'entrée vous permet de spécifier la relation entre les colonnes en entrée dans l'étape Change Capture et les colonnes Sortie. L'onglet Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien de sortie.