0 / 0
Zurück zur englischen Version der Dokumentation

Differenzstufe in DataStage

Letzte Aktualisierung: 12. März 2025
Stage 'Difference' in DataStage

Die Stage 'Difference' führt für zwei Eingabedatasets, bei denen es sich um unterschiedliche Versionen desselben Datasets handelt, die als Dataset 'Vorher' und 'Nachher' bezeichnet werden, Datensatz für Datensatz einen Vergleich durch.

Die Stage 'Difference' ist eine verarbeitende Stage. Sie gibt ein einziges Dataset aus, dessen Datensätze die Differenzen darstellt. Die Stage geht davon aus, dass die Eingabedatasets schlüsselpartitioniert und in aufsteigender Reihenfolge nach den Schlüsselspalten, die Sie für den Vergleich durch die Stage 'Difference' angeben, sortiert sind. Sie können dies mithilfe der Stage 'Sort' oder durch Verwendung der integrierten Sortier- und Partitionierungsmöglichkeiten der Stage 'Difference' erreichen.

Der Vergleich wird auf der Basis einer Gruppe von Differenzschlüsselspalten durchgeführt. Zwei Datensätze sind Kopien voneinander, wenn sie für alle Differenzschlüssel denselben Wert aufweisen. Sie können optional auch Änderungswerte angeben. Wenn zwei Datensätze identische Schlüsselspalten haben, können Sie die Wertspalten in den Datensätzen vergleichen, um festzustellen, ob die eine eine bearbeitete Kopie der anderen ist.

Die Stufe "Difference" ist ähnlich, aber nicht identisch mit der Stufe "Change Capture", die in Stufe "Change Capture" in DataStage beschrieben wird. Die Stage 'Change Capture' soll zusammen mit der Stage 'Change Apply' verwendet werden. Sie erstellt ein Änderungsdataset, das Änderungen enthält, die auf das Dataset before angewendet werden müssen, um es in das Dataset after umzuwandeln. Die Stage 'Difference' gibt die 'Vorher'- und 'Nachher'-Zeilen in das Ausgabedataset aus und außerdem einen Code, der angibt, ob es Unterschiede gibt. Wenn die Vorher- und die Nachher-Daten dieselben Spaltennamen aufweisen, überschreibt ein Dataset in der Tag das andere Dataset mit dem Ergebnis, dass nur eine Spaltengruppe in der Ausgabe angezeigt wird. Welches Dataset ausgegeben wird, wird durch die Einstellungen im Abschnitt 'Linkreihenfolge' auf der Registerkarte Stage gesteuert. Wenn Ihre Vorher- und Nachher-Datasets unterschiedliche Spaltennamen aufweisen, können Spalten aus beiden Datasets wie durch die Zuordnungsoptionen festgelegt ausgegeben werden, wenn Sie Spalten auf der Registerkarte Ausgabe bearbeiten. Alle Spalten, die in den Eingabedatasets als Schlüssel- oder Wertspalten festgelegt sind, müssen dieselben Namen haben.

Wenn Sie auf die Stage 'Difference' doppelklicken, wird die Eigenschaftsanzeige geöffnet. Die Eigenschaftsanzeige verfügt über drei Registerkarten:

  • Stage. Diese Seite ist immer vorhanden und wird verwendet, um allgemeine Informationen zur Stage anzugeben.
  • Eingabe. Hier geben Sie Details zu den Daten an, die gruppiert oder aggregiert werden.
  • Ausgabe. Auf dieser Seite geben Sie Details zu den Gruppen an, die von der Stage ausgegeben werden.

Registerkarte 'Eingabe'

Die Registerkarte Spalten gibt die Spaltendefinitionen eingehender Daten an. Auf der Registerkarte Erweitert können Sie die Standardeinstellungen für die Pufferung für den Eingabelink ändern.

Registerkarte 'Ausgabe'

Die Stage 'Difference' kann nur einen Ausgabelink haben.

Der Abschnitt Spalten gibt die Spaltendefinitionen der Daten an. Klicken Sie unten im Abschnitt 'Spalten' auf Bearbeiten, um die Beziehung zwischen den Spalten, die in die Stage 'Difference' eingegeben werden, und den Ausgabespalten anzugeben. Im Abschnitt Erweitert können Sie die Standardeinstellungen für die Pufferung für den Ausgabelink ändern.