0 / 0
Zurück zur englischen Version der Dokumentation

Entwerfen von DataStage

Letzte Aktualisierung: 12. März 2025
Entwerfen von DataStage

DataStage® -Abläufe sind die Assets zur Entwicklungszeit, die Datenintegrationslogik enthalten.

Sie können einen leeren DataStage -Ablauf erstellen und diesem Connector und Stages hinzufügen oder einen vorhandenen DataStage -Ablauf aus einer ISX-oder ZIP-Datei importieren.

Die Grundbausteine eines Ablaufs sind:
  • Datenquellen, die Daten lesen
  • Stages, die die Daten transformieren
  • Datenziele, die Daten schreiben
  • Links, die die Quellen, Stages und Ziele miteinander verbinden

Palette und Erstellungsbereich in IBM DataStage

DataStage -Abläufe und die zugehörigen Objekte sind in Projekten organisiert. Öffnen Sie zu Beginn ein vorhandenes Projekt oder erstellen Sie ein neues Projekt.

DataStage -Ablauf erstellen

Führen Sie die folgenden Schritte aus, um einen DataStage -Ablauf zu erstellen.

  1. Öffnen Sie ein vorhandenes Projekt oder erstellen Sie ein Projekt.
  2. Klicken Sie auf der Registerkarte Vermögenswerte auf Neue Anlage + > Daten umwandeln und integrieren.
  3. Verwenden Sie auf der Seite DataStage -Ablauf erstellen eine der beiden folgenden Methoden, um den DataStage -Ablauf zu erstellen:
    • Klicken Sie auf die Registerkarte Neu , fügen Sie die erforderlichen Details für den DataStage -Ablauf hinzu und klicken dann auf Erstellen. Der neue DataStage -Ablauf wird ohne Objekte im DataStage Designer-Erstellungsbereich geöffnet.
    • Klicken Sie auf die Registerkarte Lokale Datei und laden Sie dann eine ISX-oder ZIP-Datei von Ihrem lokalen Computer hoch. Klicken Sie anschließend auf Erstellen. Wenn der Importprozess abgeschlossen ist, schließen Sie die Seite für den Importbericht und öffnen dann den importierten DataStage -Ablauf über die Registerkarte Assets des Projekts.
  4. Ziehen Sie Connectors oder Stages aus der Palette in den Erstellungsbereich des DataStage -Designs als Knoten und ordnen Sie sie nach Bedarf an. Verbinden Sie diese Knoten im Erstellungsbereich, indem Sie den Mauszeiger über einen Knoten bewegen, damit ein Pfeil auf dem Knoten angezeigt wird. Klicken Sie dann auf das Pfeilsymbol und ziehen Sie es zu dem Knoten, zu dem Sie eine Verbindung herstellen wollen.

    Mit dieser Aktion wird eine Verbindung zwischen den Knoten erstellt.

    Um eine Verbindung zu Remote-Daten herzustellen, siehe Verbinden mit einer Datenquelle in DataStage.

  5. Doppelklicken Sie auf einen Knoten, um die Eigenschaftenanzeige zu öffnen, in der Sie Konfigurationen und Einstellungen für den Knoten angeben können.
  6. Klicken Sie auf Ausführen, wenn Sie den Ablauf eingerichtet haben.

    Der Ablauf wird automatisch gespeichert, kompiliert und ausgeführt. Sie können Protokolle für die Kompilierung und die Jobausführung anzeigen.

Nachdem der Ablauf in einen Job kompiliert wurde, können Sie ihn erneut ausführen, einen Zeitplan festlegen, den Job überwachen und die Umgebung aktualisieren, in der er ausgeführt werden soll. Weitere Informationen zum Aktualisieren der DataStage umgebung, in der Ihre Jobs ausgeführt werden sollen, finden Sie unter "Einrichten von DataStage -UmgebungsdefinitionenDataStage -Umgebungen ".

DataStage -Ablauf bearbeiten

Mit den folgenden Aktionen können Sie einen DataStage -Flow bearbeiten.

  • Ziehen Sie eine Stage oder einen Connector und legen Sie sie bzw. ihn auf einem Link zwischen zwei Knoten ab, die sich bereits im DataStage -Erstellungsbereich befinden. Für den neuen Knoten werden automatisch Links hinzugefügt und die Spalten werden automatisch weitergegeben. Klicken Sie erneut auf Ausführen , um die Ergebnisse anzuzeigen.
  • Heben Sie die Zuordnung von Links zu Knoten im Erstellungsbereich von DataStage manuell auf, indem Sie den Mauszeiger über die Knoten bewegen und auf die Endpunkte der Links klicken.
  • Ziehen Sie eine Stage oder einen Connector aus der Palette und legen Sie sie bzw. ihn auf einem Link ab, der sich bereits im Erstellungsbereich befindet. Die Stage oder der Connector wird automatisch mit dem Knoten auf beiden Seiten des Knotens verknüpft und die Spalten im DataStage -Ablauf werden automatisch weitergegeben.
  • Klicken Sie auf das Symbol Ersetzen Rundes Aktualisierungssymbol und wählen Sie eine andere Bewegung, um Ihre Bewegung zu ersetzen. Diese Aktion ist auch für Build-, Custom- und Wrapped-Stufen sowie für Subflows und Java-Bibliotheken verfügbar.

Daten voranzeigen

Sie können Daten in Ihrem DataStage bearbeiten und in der Vorschau anzeigen. Klicken Sie im Canvas mit der rechten Maustaste auf Ihre Verbindung und wählen Sie Datenvorschau. Sie können eine Vorschau Ihrer Daten mit allen Verbindungen und Dateikonnektoren anzeigen. Weitere Informationen zu Dateikonnektoren finden Sie unter Dateikonnektoren in DataStage.

Sie können zum Beispiel eine Vorschau der Zeit und der Mikrosekunden mit der Zeitzone anzeigen. Die beiden Datentypen " time und " microseconds time erscheinen im Standardformat: HH:mm:ss für die Zeit und " HH:mm:ss.SSSSSS für die Mikrosekundenzeit.

Für Zeit-, Zeitstempel- und Mikrosekunden-Zeitdatentypen, die die Zeitzone enthalten, passt DataStage die Zeit basierend auf der Zeitzone an und zeigt die UTC-Zeit im Standardformat an. Beispiel:
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
wobei die Zeitzone konvertiert und als " 10:00:01 im Standardzeitformat angezeigt wird.

Wichtige Hinweise

Sensible Informationen und verschlüsselte Eigenschaftswerte
Die Angabe verschlüsselter Eigenschaftswerte wie Kennwörter in DataStage -Abläufen wird nicht empfohlen. Erstellen Sie stattdessen einen Parametersatz des Typs Verschlüsselt mit einem benannten Parameter und geben keinen Standardwert für den Parameter an. Verweisen Sie in Ihrem Ablauf auf den verschlüsselten Parametersatz und geben Sie den benannten Parameter für den Eigenschaftswert an, z. B. #<parameter set>.<parameter name>#. Geben Sie den verschlüsselten Wert des Parameters #parameter set.parameter name# in dem Job an, der Ihren Ablauf ausführt.
Benennung von Dateien in Quellen und Zielen zur Vermeidung von Datenverlust
Verwenden Sie in den meisten Fällen nicht denselben Dateinamen in der Quelle wie im Ziel, wenn die Quelle und das Ziel auf dieselbe Datenbank oder dasselbe Speichersystem verweisen. Diese Regel gilt für Dateien und Datenbanktabellen. Sind die Namen identisch, können die Daten beschädigt werden.
Weitergabe von Spaltenmetadatenänderungen
Wenn Sie die Metadaten einer Spalte ändern, werden die Änderungen automatisch nach unten weitergegeben. Vorgeschaltete Änderungen gelten nicht für eine Spalte, sobald Sie ihre Metadaten geändert haben. Wenn Sie eine Spalte löschen, wird sie durch Ändern der Spalte in einer späteren Phase nicht wieder hinzugefügt.
Spaltenweitergabe während der Ausführung
Wenn RCP festgelegt ist und Ihr Job bei der Ausführung zusätzliche Spalten findet, die nicht in den Metadaten definiert sind, übernimmt er diese zusätzlichen Spalten und gibt sie über den Rest des Jobs weiter. Dadurch werden Fehler aufgrund fehlender Zuordnungen vermieden.
Parameter hinzufügen
Siehe Parameter hinzufügen.

Weitere Informationen

Beispiele

DataStage -Ablauf erstellen

Das folgende Video zeigt ein Beispiel für die Erstellung eines einfachen DataStage -Ablaufs.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.

DataStage -Ablauf in ein Projekt importieren

Das folgende Video zeigt ein Beispiel für den Import eines DataStage -Ablaufs in ein Projekt.

Dieses Video bietet eine visuelle Methode zum Erlernen der Konzepte und Tasks in dieser Dokumentation.