0 / 0
Zurück zur englischen Version der Dokumentation

Stufe "Datensätze kombinieren" (DataStage)

Letzte Aktualisierung: 12. März 2025
Stage "Combine Records" in DataStage

Die Stage "Combine Records" ist eine Umstrukturierungsstage. Diese Stage kombiniert Datensätze (d. h. Zeilen), in denen bestimmte Schlüsselspaltenwerte identisch sind, in Vektoren von Unterdatensätzen.

Die Stage "Combine Records" kann einen einzigen Eingabelink und einen einzigen Ausgabelink haben.

Die Stage "Combine Records" kombiniert Datensätze (d. h. Zeilen), in denen bestimmte Schlüsselspaltenwerte identisch sind, in Vektoren von Unterdatensätzen. Als Eingabe verwendet die Stage ein Dataset, in dem eine oder mehrere Spalten als Schlüssel ausgewählt sind. Alle angrenzenden Datensätze, deren Schlüsselspalten denselben Wert enthalten, werden als Unterdatensätze in denselben Datensatz aufgenommen.
Zeigt Spalten an, die in einem Vektor von Unterdatensätzen kombiniert werden

Die Dataseteingabe für die Stage "Combine Records" muss schlüsselpartitioniert und sortiert sein, wodurch sichergestellt wird, dass sich Zeilen mit denselben Schlüsselspaltenwerten in derselben Partition befinden und von demselben Knoten verarbeitet werden. Die Auswahl der (automatischen) Partitionierungsmethode stellt sicher, dass Partitionierung und Sortierung durchgeführt werden. Wenn die Sortierung und Partitionierung in separaten Stages vor der Stage "Combine Records" ausgeführt werden, erkennt DataStage® im automatischen Modus dies und führt keine erneute Partitionierung durch (alternativ können Sie explizit dieselbe Partitionierungsmethode angeben).

Im Stage-Editor gibt es drei Registerkarten:

  • Registerkarte "Stage". Diese Registerkarte ist immer vorhanden und wird verwendet, um allgemeine Informationen zur Stage anzugeben.
  • Registerkarte "Eingabe". Auf dieser Registerkarte geben Sie die Details zu dem einzelnen Eingabesatz an, aus dem Sie Datensätze auswählen.
  • Registerkarte "Ausgabe". Auf dieser Registerkarte geben Sie Details zu den verarbeiteten Daten an, die von der Stage ausgegeben werden.

Registerkarte 'Eingabe'

Geben Sie im Abschnitt "Beschreibung" eine optionale Beschreibung des Eingabelinks an. Geben Sie im Abschnitt "Partitionen" an, wie eingehende Daten vor dem Konvertieren partitioniert werden. Geben Sie im Abschnitt "Spalten" die Spaltendefinitionen eingehender Daten an. Im Abschnitt "Erweitert" können Sie die Standardpuffereinstellungen für den Eingabelink ändern.

Registerkarte 'Ausgabe'

Auf der Registerkarte Ausgabe können Sie Details zur Datenausgabe der Stage "Combine Records" angeben. Die Stage "Combine Records" kann nur einen Ausgabelink haben.

Geben Sie im Abschnitt "Beschreibung" eine optionale Beschreibung des Eingabelinks an. Geben Sie im Abschnitt "Partitionen" an, wie eingehende Daten vor dem Konvertieren partitioniert werden. Geben Sie im Abschnitt "Spalten" die Spaltendefinitionen eingehender Daten an. Im Abschnitt "Erweitert" können Sie die Standardpuffereinstellungen für den Eingabelink ändern.

Geben Sie im Abschnitt "Beschreibung" eine optionale Beschreibung des Eingabelinks an. Der Abschnitt 'Spalten' gibt die Spaltendefinitionen der Daten an. Im Abschnitt "Erweitert" können Sie die Standardeinstellungen für die Pufferung für den Ausgabelink ändern.