0 / 0
Zurück zur englischen Version der Dokumentation

Stufe vergleichen in DataStage

Letzte Aktualisierung: 12. März 2025
Stage 'Compare' in DataStage

In der Stage 'Compare' wird ein Vergleich von Datensätzen in zwei vorsortierten Eingabedatasets auf Spaltenbasis durchgeführt. Sie können den Vergleich auf angegebene Schlüsselspalten beschränken.

Die Stage 'Compare' ist eine verarbeitende Stage. Sie kann zwei Eingabelinks und einen Ausgabelink haben.

Die Stage 'Compare' ändert die Tabellendefinition, die Partitionierung oder den Inhalt der Datensätze in keinem der Eingabedatasets. Sie überträgt beide Datasets intakt an ein einzelnes Ausgabedataset, das in der Stage generiert wird. Die Vergleichsergebnisse werden ebenfalls in dem Ausgabedataset aufgezeichnet.

Sie können die Laufzeit-Spaltenweitergabe in dieser Stage verwenden und zulassen, dass IBM DataStage das Ausgabespaltenschema zur Laufzeit für Sie definiert. Die Stage gibt ein Dataset mit drei Spalten aus:

  • Ergebnis. Enthält den Code, der das Ergebnis des Vergleichs angibt.
  • erste. Ein Unterdatensatz, der die Spalten des ersten Eingabelinks enthält.
  • Sekunde. Ein Unterdatensatz, der die Spalten des zweiten Eingabelinks enthält.
Wenn Sie die Metadaten des Ausgabelinks selbst angeben, müssen Sie die Spalten, die die Daten enthalten, als Unterdatensätze einer übergeordneten Spalte definieren, die Sie ebenfalls definieren. Da IBM DataStage die Angabe von zwei Gruppen mit identischen Spaltennamen nicht zulässt, definieren Sie sie als untergeordnete Datensätze, damit ihnen eindeutige Namen wie 'first.col1' und 'second.col1' zugewiesen werden können. Geben Sie Metadaten an, indem Sie die folgenden Schritte ausführen:
  1. Geben Sie die übergeordnete Spalte für die Ausgabedaten an, die dem ersten Eingabelink entspricht, und legen Sie als SQL-Typ 'Unbekannt' fest.
  2. Geben Sie die tatsächlichen Spalten an, die Ihre Daten enthalten, und definieren Sie diese als Unterdatensätze der übergeordneten Spalte. Benennen Sie die einzelnen Spalten nach dem Muster 'first.colname', z. B. 'first.col1', 'first.col2' usw. Machen Sie jede Spalte zu einem Unterdatensatz, indem Sie die Spalte auswählen, im Kontextmenü die Option Zeile bearbeiten auswählen und dann eine Ebenennummer (z. B. 03) für diese Spalte angeben. (Sie können diesen Prozess beschleunigen, indem Sie die erste Spalte als Unterdatensatz festlegen und die Funktion 'Werte weitergeben' verwenden, um die übrigen Spalten ebenfalls als Unterdatensätze der übergeordneten Spalte zu definieren.)
  3. Geben Sie die übergeordnete Spalte für Ausgabedaten an, die dem zweiten Eingabelink entspricht, und legen Sie als SQL-Typ 'Unbekannt' fest.
  4. Geben Sie die eigentlichen Spalten an, die die Daten aus dem zweiten Eingabelink enthalten, benennen Sie sie nach dem Muster 'secondcolname (z. B. 'second.col1', 'second.col2') und definieren Sie sie als Unterdatensätze der übergeordneten Spalte.

Wenn Sie auf die Stage 'Compare' doppelklicken, wird die Eigenschaftsanzeige geöffnet. Die Eigenschaftsanzeige verfügt über drei Registerkarten:

  • Stage. Diese Seite ist immer vorhanden und wird verwendet, um allgemeine Informationen zur Stage anzugeben.
  • Eingabe. Hier geben Sie Details zu den Daten an, die gruppiert oder aggregiert werden.
  • Ausgabe. Auf dieser Seite geben Sie Details zu den Gruppen an, die von der Stage ausgegeben werden.

Registerkarte 'Eingabe'

Der Abschnitt Spalten gibt die Spaltendefinitionen eingehender Daten an. Auf der Registerkarte Erweitert können Sie die Standardeinstellungen für die Pufferung für den Eingabelink ändern.

Registerkarte 'Ausgabe'

Der Abschnitt Spalten gibt die Spaltendefinitionen der Daten an. Im Abschnitt Erweitert können Sie die Standardeinstellungen für die Pufferung für den Ausgabelink ändern.