Zurück zur englischen Version der Dokumentation
Stage 'External Filter': Registerkarte 'Stage' (DataStage)
Stufe des externen Filters: Registerkarte Stufe (DataStage)
Letzte Aktualisierung: 12. März 2025
Auf der Registerkarte 'Stage' für die Stage 'External Filter' können Sie Aspekte der Stage 'External Filter' steuern.
Im Abschnitt Eigenschaften auf der Registerkarte 'Stage' können Sie angeben, welche Funktion die Stage erfüllt. Im Abschnitt Erweitert können Sie angeben, wie die Stage ausgeführt wird.
Eigenschaften
Die Stage 'External Filter' hat die folgenden Eigenschaften:
Kategorie/Eigenschaft | Werte | Standard | Verbindlich? | Wiederholungen? | Abhängig von |
---|---|---|---|---|---|
Optionen/Filterbefehl | Zeichenfolge | Nicht zutreffend | Y | N | Nicht zutreffend |
Optionen/Argumente | Zeichenfolge | Nicht zutreffend | N | N | Nicht zutreffend |
Filterbefehl
Gibt die auszuführende Filterbefehlszeile und alle erforderlichen Befehlszeilenoptionen an. Beispiel:
grep
Wenn Sie den Befehl grep in der Stage 'External Filter' verwenden, werden führende oder abschließende Leerzeichen, die in Spaltendaten enthalten sind, nicht an die Ausgabe der Stage gesendet. Um dieses Verhalten zu vermeiden, verwenden Sie eine Wrap-Stage. In diesem Beispiel wird ein Komma (,) verwendet, um die Felder zu begrenzen:
#!/bin/sh
# ------------------------------------------------------------
# mygrep.op -- 'wrapped grep' example
# ------------------------------------------------------------
#
cat <<END
{
wrapped, kind = parallel,
command = "grep 'abc'",
port = { input = 0, fd = 0, schema = "record{delim=','}()" },
port = { output = 0, fd = 1, schema = "record{delim=','}()" },
usage = "mygrep"
}
END
# ------------------------------------------------------------
# End of wrapper
# ------------------------------------------------------------
Argumente
Ermöglicht die Angabe von Argumenten, die für die Befehlszeile erforderlich sind. Beispiel:
\(cancel\).*\1
Zusammen mit dem Befehl grep würden alle Datensätze, die die Zeichenfolge "cancel" zweimal enthalten, extrahiert und andere Datensätze gelöscht.
Erweitert
In diesem Abschnitt können Sie Folgendes angeben:
- Ausführungsmodus. Die Stage kann im parallelen Modus oder im sequenziellen Modus ausgeführt werden. Im parallelen Modus werden die Eingabedaten von den verfügbaren Knoten, die in der Konfigurationsdatei angegeben sind, und durch alle Knoteneinschränkungen, die im Abschnitt Erweitert angegeben sind, verarbeitet. Im sequenziellen Modus wird das gesamte Dataset vom Conductorknoten verarbeitet.
- Kombinierbarkeitsmodus. Dies ist standardmäßig 'Automatisch', was es IBM® DataStage® ermöglicht, die Operatoren, die parallelen Stages zugrunde liegen, so zu kombinieren, dass sie im selben Prozess ausgeführt werden, wenn dies für diesen Stagetyp sinnvoll ist.
- Partitionierung beibehalten. Für diesen Modus lautet die Standardeinstellung Festlegen. Sie können explizit Festlegen oder Löschen auswählen. Wählen Sie Festlegen aus, um anzufordern, dass die nächste Stage versuchen soll, die Partitionierung beizubehalten.
War das Thema hilfreich?
0/1000