Comparez l'étape dans DataStage
L'étape Comparer effectue une comparaison colonne par colonne des enregistrements dans deux jeux de données d'entrée prétriés. Vous pouvez limiter la comparaison aux colonnes de clé spécifiées.
L'étape Comparer est une étape de traitement. Elle peut comporter deux liens d'entrée et un lien de sortie unique.
L'étape Comparer ne change pas la définition de table, le partitionnement ou le contenu des enregistrements dans les jeux de données d'entrée. Elle transfère les deux jeux de données tels quels dans un jeu de données de sortie unique qu'elle génère. Les résultats de la comparaison sont également enregistrés dans le jeu de données de sortie.
Vous pouvez utiliser la propagation des colonnes d'exécution dans cette étape et permettre à IBM DataStage de définir le schéma de la colonne de sortie pour vous au moment de l'exécution. L'étape génère un jeu de données comportant trois colonnes :
- result. Contient le code indiquant le résultat de la comparaison.
- first. Sous-enregistrement contenant les colonnes du premier lien d'entrée.
- seconde. Sous-enregistrement contenant les colonnes du deuxième lien d'entrée.
- Indiquez la colonne parent des données de sortie correspondant au premier lien d'entrée et définissez le type SQL sur inconnu.
- Indiquez les colonnes réelles qui portent vos données et faites ces sous-enregistrements de la colonne parent. Nommez d'abord chaque colonne.colname, par exemple first.col1, first.col2, etc. Faites de chaque colonne un sous-enregistrement en sélectionnant la colonne, en sélectionnant édition d'une ligne dans le menu de raccourci et en indiquant un numéro de niveau (par exemple, 03) pour cette colonne. (Vous pouvez accélérer ce processus en faisant de la première colonne un sous-enregistrement et en utilisant la fonction de propagation des valeurs pour créer les sous-enregistrements des colonnes restantes de la colonne parent.)
- Indiquez la colonne parent pour les données de sortie correspondant au second lien d'entrée et définissez le type SQL sur inconnu.
- Spécifiez les colonnes réelles qui portent les données à partir du deuxième lien d'entrée, nommez-les secondes.Colname (par exemple, second.col1, second.col2) et réalisez ces sous-enregistrements de la colonne parent.
Lorsque vous cliquez deux fois sur l'étape Compare, le panneau de propriétés s'ouvre. Le panneau de propriétés comporte trois onglets :
- Étape. Elle est toujours présente et sert à indiquer des informations générales sur l'étape.
- Entrée. Il s'agit de l'emplacement où vous spécifiez des détails sur les données regroupées ou agrégées.
- Sortie. C'est ici que vous spécifiez des détails sur les groupes en sortie de l'étape.
Onglet Entrée
La section Colonnes indique les définitions de colonne des données entrantes. L'onglet Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien d'entrée.
Onglet Sortie
La section Colonnes indique les définitions de colonne des données. La section Avancé vous permet de modifier les paramètres de mise en mémoire tampon par défaut pour le lien de sortie.