Stufe Spaltenimport: Registerkarte Ausgabe (DataStage®)
Auf der Registerkarte 'Ausgabe' können Sie Details zur Datenausgabe aus der Stage 'Column Import' angeben. Auf den Registerkarten in dieser Stage können Sie Details dazu angeben, wie Daten in der Spalte formatiert werden sollen, und zu der Beziehung zwischen den Spalten, die eingegeben werden, und den Ausgabespalten. Sie können die Standardpuffereinstellungen für den Ausgabelink ändern und die Spaltendefinitionen anzeigen.
Die Stage 'Column Import' kann nur einen Ausgabelink haben, kann aber auch einen Zurückweisungslink aufweisen, der Datensätze enthält, die zurückgewiesen wurden.
Im Abschnitt Format können Sie Details dazu angeben, wie die Daten in der Spalte, die Sie importieren, formatiert sind, damit die Stage sie in separate Spalten aufteilen kann. Der Abschnitt Spalten gibt die Spaltendefinitionen der Daten an. Klicken Sie auf Bearbeiten im Abschnitt Spalten, um die Zuordnung anzugeben. Als Zuordnung wird die Beziehung zwischen den Spalten, die in die Stage 'Column Import' eingegeben werden, und den Ausgabespalten bezeichnet. Die Zuordnung wird im Abschnitt Zuordnungen aus Spalteneingabe angegeben. Auf der Registerkarte Erweitert können Sie die Standardeinstellungen für die Pufferung für die Ausgabelinks ändern.
Abschnitt 'Ausgabelinkformat'
Sie verwenden den Formatabschnitt in der gleichen Weise, wie Sie das Format einer Flachdatei (Flatfile) beschreiben würden, die Sie lesen.
In den folgenden Abschnitten werden die Eigenschaftstypen und Eigenschaften aufgelistet, die für jeden Typ verfügbar sind.
Datensatzebene
Diese Eigenschaften definieren Details, die festlegen, wie Datensätze in der unstrukturierten Datei formatiert werden. Wenn Sie ein Zeichen eingeben können, kann es sich in der Regel um ein ASCII-Zeichen handeln. Die verfügbaren Eigenschaften werden in der folgenden Liste angezeigt:
- Abschlussbegrenzer. Geben Sie das einzelne Zeichen an, das nach der letzten Spalte eines Datensatzes anstelle des Feldbegrenzers geschrieben wird. Geben Sie ein Zeichen ein oder wählen Sie eines der folgenden Zeichen aus: Leerzeichen, Ende, Keine, Null, Tabulator oder Komma. IBM DataStage überspringt die angegebene Begrenzerzeichenfolge beim Lesen der Datei. Das folgende Diagramm dient der Veranschaulichung.
- Leerzeichen. Die letzte Spalte jedes Datensatzes enthält keine abschließenden Leerzeichen, die am Ende des Datensatzes gefunden werden.
- Ende. Die letzte Spalte eines jeden Datensatzes enthält nicht den Feldbegrenzer. Diese Einstellung ist die Standardeinstellung.
- Keine. Die letzte Spalte jedes Datensatzes hat keinen Begrenzer, der für Felder mit fester Breite verwendet wird.
- Null. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Nullzeichen begrenzt.
- Komma. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Kommazeichen begrenzt.
- Tabulator. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Tabulatorzeichen begrenzt.
- Intakt. Die Eigenschaft 'Intakt' gibt eine Kennung (ID) für ein Teilschema an. Ein Teilschema gibt an, dass nur eine oder mehrere Spalten, die im Schema benannt sind, von der Stage geändert werden können. Alle anderen Spalten in der Zeile werden unverändert übergeben. Die Datei, die das Teilschema enthält, wird in der Eigenschaft 'Schemadatei' auf der Registerkarte Ausgaben angegeben. Diese Eigenschaft hat eine abhängige Eigenschaft:
- Intaktheit überprüfen. Wählen Sie diese Einstellung aus, um die Validierung des Teilschemas beim Importieren der Datei(en) zu erzwingen. Diese Einstellung kann die Leistung beeinträchtigen.
- Datensatzbegrenzerzeichenfolge. Geben Sie die Zeichenfolge am Ende jedes Datensatzes an. Geben Sie ein oder mehrere Zeichen ein. Diese Einstellung und der Datensatzbegrenzer (Standardeinstellung) sowie Datensatztyp und Datensatzpräfix schließen sich gegenseitig aus.
- Datensatzbegrenzer. Geben Sie das einzelne Zeichen am Ende jedes Datensatzes an. Ein Zeichen eingeben oder eine der folgenden Optionen auswählen:
- UNIX Newline (der Standard)
- null
(Um einen DOS-Zeilenumbruch anzugeben, verwenden Sie die Eigenschaft Satzbegrenzungszeichenfolge, die auf "\R\N" eingestellt ist, oder wählen Sie im Menü
)Datensatzbegrenzer und Satzbegrenzerzeichenfolge, Datensatzpräfix und Datensatztyp schließen sich gegenseitig aus.
- Datensatzlänge. Wählen Sie dort 'Fest' aus, wo Felder mit fester Länge gelesen werden. IBM DataStage berechnet die entsprechende Länge für den Datensatz. Alternativ können Sie die Länge von Datensätzen fester Länge in Form der Anzahl an Byte angeben. Diese Einstellung wird nicht standardmäßig verwendet (Standarddateien sind durch Kommas begrenzt).
- Datensatzpräfix. Gibt an, dass einem Datensatz variabler Länge ein Präfix mit 1, 2 oder 4 Byte Länge vorangestellt wird. Für diese Option ist standardmäßig '1' als Wert festgelegt. Diese Einstellung und der Datensatzbegrenzer (Standardeinstellung) sowie die Zeichenfolge und der Datensatztyp des Datensatzbegrenzers schließen sich gegenseitig aus.
- Datensatztyp. Gibt an, dass Daten aus geblockten Datensätzen variabler Länge (variabel) oder impliziten Datensätze (implizit) bestehen. Wenn Sie die Eigenschaft 'Implizit' auswählen, werden Daten als Datenstrom ohne explizite Datensatzbegrenzungen geschrieben. Das Ende des Datensatzes wird abgeleitet, wenn alle durch das Schema definierten Spalten syntaktisch analysiert werden. Sie können die variierende Eigenschaft verwenden, um eines der folgenden blockierten oder übergreifenden IBM-Formate anzugeben: V, VB, VS, VBS oder VR. Daten werden unter Verwendung eines dieser Formate importiert. Diese Formate sind für den Export nicht verfügbar.
Diese Eigenschaft und 'Datensatzlänge', 'Datensatzbegrenzer', 'Datensatzbegrenzerzeichenfolge' und 'Datensatzpräfix' schließen sich gegenseitig aus. Sie wird standardmäßig nicht verwendet.