0 / 0
Zurück zur englischen Version der Dokumentation

Änderung der Erfassungsphase in DataStage

Letzte Aktualisierung: 12. März 2025
Stage 'Change Capture' in DataStage

Die Stage 'Change Capture' ist eine verarbeitende Stage, bei der zwei Datasets verglichen werden und eine Aufzeichnung der Unterschiede erstellt wird.

Die Stage 'Change Capture' empfängt zwei Eingabedatasets, die als Vorher- und Nachherdatasets bezeichnet werden, und gibt ein einzelnes Dataset aus, dessen Datensätze die Änderungen darstellen, die an dem Vorher-Dataset vorgenommen wurden, um das Nachher-Dataset zu erhalten. Die Stage generiert ein Änderungsdataset, dessen Tabellendefinition aus der Tabellendefinition des Nachher-Datasets unter Hinzufügung einer Spalte übernommen wird: Die Spalte für einen Änderungscode mit Werten, die die vier Aktionen (Insert, Delete, Copy und Edit) codieren. Das Flag für die Beibehaltung der Partitionierung wird im Änderungsdataset gesetzt.

Der Vergleich basiert auf einer Gruppe von Schlüsselspalten. Zeilen aus den beiden Datasets werden als Kopien voneinander betrachtet, wenn sie dieselben Werte in diesen Schlüsselspalten aufweisen. Sie können optional auch Änderungswerte angeben. Wenn zwei Zeilen identische Schlüsselspalten haben, können Sie die Wertspalten in den Zeilen vergleichen, um festzustellen, ob die eine eine bearbeitete Kopie der anderen ist.

Die Stage geht davon aus, dass die eingehenden Daten schlüsselpartitioniert und in aufsteigender Reihenfolge sortiert sind. Die Spalten, über die die Daten hashverschlüsselt werden, müssen die Schlüsselspalten sein, die für den Datenvergleich verwendet werden. Sie können die Sortierung und die Partitionierung mithilfe der Stage 'Sort' oder durch Verwendung der integrierten Sortier- und Partitionierungsmöglichkeiten der Stage 'Change Capture' erreichen.

Sie können die begleitende Stufe Change Apply verwenden, um die Änderungen aus der Stufe Change Capture mit dem ursprünglichen Vorher-Datensatz zu kombinieren, um den Nachher-Datensatz zu reproduzieren (siehe Switch-Stufe in DataStage).

Die Phase der Änderungserfassung ist der in Differenzphase in DataStage beschriebenen Differenzphase sehr ähnlich.

Wenn Sie auf die Stage doppelklicken, wird die Eigenschaftsanzeige geöffnet. Die Eigenschaftsanzeige verfügt über drei Registerkarten:

  • Stage. Diese Seite ist immer vorhanden und wird verwendet, um allgemeine Informationen zur Stage anzugeben.
  • Eingabe. Hier geben Sie Details zu dem Dataset an, dessen Duplikate entfernt werden.
  • Ausgabe. Auf dieser Seite geben Sie Details zu den verarbeiteten Daten an, die in der Stage ausgegeben werden.

Registerkarte 'Eingabe'

Die Registerkarte Spalten gibt die Spaltendefinitionen eingehender Daten an. Auf der Registerkarte Erweitert können Sie die Standardeinstellungen für die Pufferung für den Eingabelink ändern.

Registerkarte 'Ausgabe'

Der Abschnitt 'Spalten' gibt die Spaltendefinitionen der Daten an. Klicken Sie im Abschnitt 'Spalten' auf Bearbeiten, um den Spalteneditor zu öffnen. Über den Abschnitt Zuordnungen aus der Eingabespalte können Sie die Beziehung zwischen den Spalten, die in die Stage 'Change Capture' eingegeben werden, und den Ausgabespalten angeben. Auf der Registerkarte Erweitert können Sie die Standardeinstellungen für die Pufferung für den Ausgabelink ändern.