0 / 0
Retourner à la version anglaise de la documentation

Combine Records stage (DataStage)

Dernière mise à jour : 12 mars 2025
Étape de combinaison d'enregistrements dans DataStage

L'étape de combinaison d'enregistrements est une étape de restructuration. Cette étape combine des enregistrements (c'est-à-dire des lignes), dans lesquels des valeurs de colonne de clé sont identiques, en vecteurs de sous-enregistrements.

L'étape de combinaison d'enregistrements peut avoir un seul lien d'entrée et un seul lien de sortie.

L'étape de combinaison d'enregistrements combine des enregistrements (c'est-à-dire des lignes), dans lesquels des valeurs de colonne de clé sont identiques, en vecteurs de sous-enregistrements. En entrée, l'étape prend un jeu de données dans lequel une ou plusieurs colonnes sont sélectionnées en tant que clés. Tous les enregistrements adjacents dont les colonnes de clé contiennent la même valeur sont regroupés dans le même enregistrement que les sous-enregistrements.
Affiche les colonnes en cours de combinaison dans un vecteur de sous-enregistrements

L'entrée de fichier de l'étape de combinaison d'enregistrements doit être partitionnée et triée, ce qui garantit que les lignes avec les mêmes valeurs de colonne de clé se trouvent dans la même partition et qu'elles seront traitées par le même noeud. Le choix de la méthode de partitionnement (auto) garantit que le partitionnement et le tri sont effectués. Si le tri et le partitionnement sont effectués sur des étapes distinctes avant l'étape Combine Records, DataStage® en mode automatique le détecte et ne le repartitionne pas (vous pouvez également spécifier explicitement la méthode de partitionnement Identique).

L'éditeur d'étape comporte trois onglets :

  • Onglet Étape. Cet onglet est toujours présent et sert à spécifier des informations générales sur l'étape.
  • Onglet Entrée. Cet onglet permet de spécifier les détails relatifs à l'ensemble d'entrées unique à partir duquel vous sélectionnez des enregistrements.
  • Onglet Sortie. Cet onglet permet de spécifier des détails sur les données traitées en sortie de l'étape.

Onglet Entrée

Indiquez une description facultative du lien d'entrée dans la section Description. Dans la section Partitions, indiquez comment les données entrantes sont partitionnées avant la conversion des données. Dans la section Colonnes, spécifiez les définitions de colonne des données entrantes. Dans la section Avancé, vous pouvez modifier les paramètres de mise en mémoire tampon par défaut pour le lien d'entrée.

Onglet Sortie

Dans l'onglet Sortie, vous pouvez spécifier des détails sur la sortie de données à partir de l'étape de combinaison des enregistrements. L'étape de combinaison des enregistrements ne peut avoir qu'un seul lien de sortie.

Indiquez une description facultative du lien d'entrée dans la section Description. Dans la section Partitions, indiquez comment les données entrantes sont partitionnées avant la conversion des données. Dans la section Colonnes, spécifiez les définitions de colonne des données entrantes. Dans la section Avancé, vous pouvez modifier les paramètres de mise en mémoire tampon par défaut pour le lien d'entrée.

Indiquez une description facultative du lien d'entrée dans la section Description. La section Colonnes indique les définitions de colonne des données. Utilisez la section Avancé pour modifier les paramètres de mise en mémoire tampon par défaut pour le lien de sortie.