0 / 0
Zurück zur englischen Version der Dokumentation

Überlegungen zum Ende der Welle (DataStage )

Letzte Aktualisierung: 12. März 2025
Überlegungen zum Ende des Arbeitsgangs in DataStage

In parallelen DataStage® -Jobs können einige Stages eine Markierung für Laufende (EOW) senden, die das Ende einer Arbeitseinheit oder Transaktion angibt. Wenn alle Datensätze, die aus dem Eingabelink extrahiert werden, in einer Arbeitseinheit (als einzelne Aufgabe bezeichnet) enthalten sind, generiert die Excel-Stage Microsoft Excel-Arbeitsblätter, die die maximale Anzahl von Datensätzen enthalten, bis alle Datensätze geschrieben wurden.

Angenommen, die Excel-Stage hat zwei Eingabelinks: DSLink1 und DSLink2. DSLink1 ist Sheet1 und DSLink2 Sheet2 zugeordnet. Die maximale Anzahl Datensätze in einem Arbeitsblatt beträgt 65.536 und DSLink1 hat 100.000 Datensätze; DSLink2 hat 150.000 Datensätze. Jedes Arbeitsblatt hat keine Spaltennamen in der ersten Zeile. In diesem Fall ist die folgende Anzahl von Datensätzen in jedem Arbeitsblatt jeder Datei enthalten.
Dateiname Sheet1 Sheet2
Workbook001.xlsx 65.536 65.536
Workbook002.xlsx 34.464 65.536
Workbook003.xlsx 0 18.928
Wenn Datensätze, die aus dem Eingabelink extrahiert werden, in zwei oder mehr Arbeitseinheiten (mehrere Aufgaben genannt) unterteilt werden, stoppt die Excel-Stage das Schreiben von Datensätzen in das Microsoft Excel-Arbeitsblatt und erstellt eine neue Microsoft Excel-Datei, wenn die Anzahl der Datensätze in einer Aufgabe die maximale Anzahl in mindestens einem Arbeitsblatt überschreitet. Die Excel-Stage schreibt keine Datensätze in der nächsten Aufgabe in die vorherige Datei, auch wenn ein Arbeitsblatt mehr Datensätze enthalten kann. Angenommen, jeder Link enthält die folgende Anzahl von Datensätzen in jeder Aufgabe.
Aufgabennummer# DSLink1 DSLink2
1 90.000 50.000
2 5.000 90.000
3 5.000 10.000

In der ersten Stage erstellt die Excel-Stage eine Microsoft Excel-Datei mit dem Namen Workbook001.xlsx , die zwei Arbeitsblätter enthält: Sheet1 und Sheet2. Die Excel-Stage schreibt Datensätze, die aus DSLink1 extrahiert werden, in Sheet1 , bis sie die maximale Anzahl von Datensätzen (65.536) liest und alle Datensätze (50.000) aus DSLink2 in Sheet2 schreibt. Als Nächstes erstellt die Excel-Stage eine Microsoft Excel-Datei namens Workbook002.xlsx und schreibt die restlichen Datensätze (24.464) in der ersten Aufgabe und alle Datensätze (5.000) in der zweiten Aufgabe von DSLink1 in Sheet1. Obwohl Sheet2 von Workbook001.xlsx die maximale Anzahl der Datensätze nicht überschreitet, schreibt die Excel-Stage Datensätze (65.536) in der zweiten Aufgabe, die aus DSLink2 extrahiert wurde, in Sheet2 von Workbook002.xlsx, nicht Workbook001.xlsx. Wenn die Anzahl der Datensätze in der zweiten Aufgabe von DSLink2 die maximale Anzahl überschreitet, erstellt die Excel-Stage eine Microsoft Excel-Datei mit dem Namen Workbook003.xlsx und schreibt die restlichen Datensätze (24.464) in der zweiten Aufgabe von DSLink2 in Sheet2 von Workbook003.xlsx. Da beide Arbeitsblätter ausreichend Platz für die dritte Aufgabe haben, schreibt die Excel-Stage alle Datensätze, die aus DSLink1 (5.000) und DSLink2 (10.000) extrahiert wurden, in Sheet1 und Sheet2 von Workbook003.xlsx.

Daher wird die folgende Anzahl von Datensätzen in jedes Arbeitsblatt jeder Datei geschrieben:
Dateiname Sheet1 Sheet2
Workbook001.xlsx 65.536 aus 1. Aufgabe 50.000 aus 1. Aufgabe
Workbook002.xlsx 29.464 (= 24.464 aus 1. Aufgabe + 5.000 aus 2. Aufgabe) 65.536 aus der 2. Aufgabe
Workbook003.xlsx 5.000 aus 3. Aufgabe 34.464 (= 24.464 aus 2. Aufgabe + 10.000 aus 3. Aufgabe)