0 / 0
Zurück zur englischen Version der Dokumentation

Stufe Externe Quelle: Abschnitt Format der Registerkarte AusgabeDataStage®)

Letzte Aktualisierung: 12. März 2025
Stage 'External Source' in DataStage: Abschnitt 'Format' der Registerkarte 'Ausgabe'

Verwenden Sie den Abschnitt Format, um Informationen zum Format der Quellendaten bereitzustellen, die Sie lesen.

Diese Registerkarte hat ein ähnliches Format wie der Abschnitt "Eigenschaften".

Wenn Sie keine der Formateinstellungen ändern, erstellt die Stage eine Datei in folgendem Format:

  • Die Datei enthält Spalten variabler Länge, die in Anführungszeichen eingeschlossen sind.
  • Alle Spalten mit Ausnahme der letzten Spalte in einer Zeile werden durch ein Komma begrenzt.
  • Zeilen werden durch einen UNIX-Zeilenumbruch begrenzt.

Um einzelne Eigenschaften zu ändern, geben Sie Werte für Optionen im Abschnitt "Datensatzebene", im Abschnitt "Feldstandardwerte" oder in anderen Abschnitten an, die angezeigt werden.

Jede Eigenschaft, die Sie auf dieser Registerkarte festlegen, kann auf Spaltenebene überschrieben werden, indem Eigenschaften für einzelne Spalten im Spaltenmetadaten bearbeiten-Dialogfeld festgelegt werden.

Diese Beschreibung verwendet die Begriffe "Datensatz" und "Zeile" und "Feld" und "Spalte" austauschbar.

In den folgenden Abschnitten werden die Eigenschaftstypen und Eigenschaften aufgelistet, die für jeden Typ verfügbar sind.

Datensatzebene

Diese Eigenschaften definieren Details, die festlegen, wie Datensätze in der unstrukturierten Datei formatiert werden. Wenn Sie ein Zeichen eingeben können, kann es in der Regel ein ASCII-Zeichen sein. Die verfügbaren Eigenschaften werden in der folgenden Liste angezeigt:

  • Abschlussbegrenzer. Geben Sie das einzelne Zeichen an, das nach der letzten Spalte eines Datensatzes anstelle des Feldbegrenzers geschrieben wird. Geben Sie ein Zeichen ein oder wählen Sie eines der folgenden Zeichen aus: Leerzeichen, Ende, Keine, Null, Tabulator oder Komma. IBM DataStage überspringt die angegebene Begrenzerzeichenfolge beim Lesen der Datei. Das folgende Diagramm dient der Veranschaulichung.
    • Leerzeichen. Die letzte Spalte jedes Datensatzes enthält keine abschließenden Leerzeichen, die am Ende des Datensatzes gefunden werden.
    • Ende. Die letzte Spalte eines jeden Datensatzes enthält nicht den Feldbegrenzer. Diese Einstellung ist die Standardeinstellung.
    • Keine. Die letzte Spalte jedes Datensatzes hat keinen Begrenzer, der für Felder mit fester Breite verwendet wird.
    • Null. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Nullzeichen begrenzt.
    • Komma. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Kommazeichen begrenzt.
    • Tabulator. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Tabulatorzeichen begrenzt.
  • Intakt. Die Eigenschaft 'Intakt' gibt eine Kennung (ID) für ein Teilschema an. Ein Teilschema gibt an, dass nur eine oder mehrere Spalten, die im Schema benannt sind, von der Stage geändert werden können. Alle anderen Spalten in der Zeile werden unverändert übergeben. Die Datei, die das Teilschema enthält, wird in der Eigenschaft 'Schemadatei' auf der Registerkarte Ausgaben angegeben. Diese Eigenschaft hat eine abhängige Eigenschaft:
    • Intaktheit überprüfen. Wählen Sie diese Einstellung aus, um die Validierung des Teilschemas beim Importieren der Datei(en) zu erzwingen. Diese Einstellung kann die Leistung beeinträchtigen.
  • Datensatzbegrenzerzeichenfolge. Geben Sie die Zeichenfolge am Ende jedes Datensatzes an. Geben Sie ein oder mehrere Zeichen ein. Diese Einstellung und der Datensatzbegrenzer (Standardeinstellung) sowie Datensatztyp und Datensatzpräfix schließen sich gegenseitig aus.
  • Datensatzbegrenzer. Geben Sie das einzelne Zeichen am Ende jedes Datensatzes an. Ein Zeichen eingeben oder eine der folgenden Optionen auswählen:
    • UNIX Newline (Standardwert)
    • null

      (Um einen DOS-Zeilenumbruch anzugeben, verwenden Sie die Eigenschaft "Zeichenfolge für Datensatzbegrenzer", die auf "\R\N" gesetzt ist, oder wählen Sie Format as > DOS-Zeilenbegrenzer im Menü aus.)

      Datensatzbegrenzer und Satzbegrenzerzeichenfolge, Datensatzpräfix und Datensatztyp schließen sich gegenseitig aus.

  • Datensatzlänge. Wählen Sie dort 'Fest' aus, wo Felder mit fester Länge gelesen werden. IBM DataStage berechnet die entsprechende Länge für den Datensatz. Alternativ können Sie die Länge von Datensätzen fester Länge in Form der Anzahl an Byte angeben. Diese Einstellung wird nicht standardmäßig verwendet (Standarddateien sind durch Kommas begrenzt).
  • Datensatzpräfix. Gibt an, dass einem Datensatz variabler Länge ein Präfix mit 1, 2 oder 4 Byte Länge vorangestellt wird. Für diese Option ist standardmäßig '1' als Wert festgelegt. Diese Einstellung und der Datensatzbegrenzer (Standardeinstellung) sowie die Zeichenfolge und der Datensatztyp des Datensatzbegrenzers schließen sich gegenseitig aus.
  • Datensatztyp. Gibt an, dass Daten aus geblockten Datensätzen variabler Länge (variabel) oder impliziten Datensätze (implizit) bestehen. Wenn Sie die Eigenschaft 'Implizit' auswählen, werden Daten als Datenstrom ohne explizite Datensatzbegrenzungen geschrieben. Das Ende des Datensatzes wird abgeleitet, wenn alle durch das Schema definierten Spalten syntaktisch analysiert werden. Sie können die variierende Eigenschaft verwenden, um eines der folgenden blockierten oder übergreifenden IBM-Formate anzugeben: V, VB, VS, VBS oder VR. Daten werden unter Verwendung eines dieser Formate importiert. Diese Formate sind für den Export nicht verfügbar.

    Diese Eigenschaft und 'Datensatzlänge', 'Datensatzbegrenzer', 'Datensatzbegrenzerzeichenfolge' und 'Datensatzpräfix' schließen sich gegenseitig aus. Sie wird standardmäßig nicht verwendet.

Feldstandardwerte

Definiert Standardeigenschaften für Spalten, die aus der Datei bzw. den Dateien gelesen werden. Diese Eigenschaften werden auf alle Spalten angewendet, können jedoch über das Dialogfeld Spaltenmetadaten bearbeiten für einzelne Spalten auf der Registerkarte Spalten überschrieben werden. Eine Eigenschaft für eine einzelne Spalte wird häufig überschrieben, wenn CSV-Dateien (Comma-Separated Values, durch Kommas getrennte Werte) gelesen werden. CSV-Dateien schließen Felder häufig in Anführungszeichen ein, wenn die Felder möglicherweise ein Sonderzeichen wie z. B. den Feldbegrenzer enthalten. In diesem Fall sollte die Eigenschaft Quote für die betreffenden Spalten überschrieben werden.

Wenn Sie ein Zeichen eingeben können, kann dies normalerweise ein ASCII-Zeichen sein. Die folgenden Eigenschaften sind verfügbar:

  • Tatsächliche Feldlänge. Gibt die tatsächliche Anzahl Byte an, die übersprungen werden sollen, wenn die Länge des Felds der Einstellung der Eigenschaft für die Nullfeldlänge entspricht.
  • Begrenzer. Gibt den abschließenden Begrenzer aller Felder in dem Datensatz an. Geben Sie ein ASCII-Zeichen ein oder wählen Sie einen Begrenzer des Typs 'Leerzeichen', 'Ende', 'Keine', 'Null', 'Komma' oder 'Tabulatorzeichen' aus. IBM DataStage überspringt den Begrenzer beim Lesen.
    • Leerzeichen. Leerzeichen am Ende einer Spalte werden ignoriert, d. h., sie werden nicht als Teil der Spalte behandelt.
    • Ende. Das Ende eines Felds wird als Begrenzer verwendet, d. h., es gibt keinen separaten Begrenzer. Dies entspricht nicht der Einstellung 'None', die für Felder mit Spalten mit fester Breite verwendet wird.
    • Keine. Kein Begrenzer (wird für feste Breite verwendet).
    • Null. Es wird ein ASCII-Nullzeichen verwendet.
    • Komma. Es wird ein ASCII-Komma verwendet.
    • Tabulator. Es wird ein ASCII-Tabulatorzeichen verwendet.
  • Begrenzerzeichenfolge. Geben Sie die Zeichenfolge am Ende jedes Felds an. Geben Sie ein oder mehrere Zeichen ein. Diese Angabe und 'Begrenzer' (der Standardwert) schließen sich gegenseitig aus. Beispielsweise wird mit `, ` (Komma und nachfolgendes Leerzeichen - die Angabe der Hochkommas ist nicht erforderlich) angegeben, dass jedes Feld durch `, ` begrenzt wird, es sei denn, diese Angabe wird für einzelne Felder überschrieben. IBM DataStage überspringt die Begrenzerzeichenfolge beim Lesen.
  • Nullfeldlänge. Die Länge eines Felds variabler Länge in Byte, das eine Null enthält. Wenn ein Feld variabler Länge gelesen wird, gibt eine Länge von Nullfeldlänge im Quellenfeld an, dass das Feld eine Null enthält. Diese Angabe und der Nullfeldwert schließen sich gegenseitig aus.
  • Nullfeldwert. Gibt den Wert an, der einem Nullfeld zugeordnet wird, wenn die Quelle auf null gesetzt ist. Es kann sich um eine Zahl, eine Zeichenfolge oder ein Literal-Escapezeichen des Typs C handeln. Sie können beispielsweise einen Bytewert durch \ooo darstellen, wobei jedes Vorkommen von o eine Oktalziffer 0-7 und das erste Vorkommen von o ein Wert von < 4 ist, oder durch \xhh, wobei jedes Vorkommen von h eine Hexadezimalziffer 0-F ist. Sie müssen dieses Formular verwenden, um nicht druckbare Bytewerte zu codieren.

    Diese Eigenschaft und 'Nullfeldlänge' sowie 'Tatsächliche Länge' schließen sich gegenseitig aus. Bei der Darstellung von Daten fester Breite können Sie 'Füllzeichen' (im Abschnitt 'Allgemein' unter 'Typstandardwerte') verwenden, um ein wiederholtes abschließendes Zeichen anzugeben, wenn der von Ihnen angegebene Wert kürzer als die feste Breite des Felds ist.

    Sie können eine Liste von Nullwerten angeben, die eine Spalte enthalten kann, die null darstellt. Geben Sie ein Trennzeichen in der abhängigen Eigenschaft Trennzeichen für Nullfeldwerte an und verwenden Sie dieses Trennzeichen, um die Nullwerte in der Eigenschaft Nullfeldwert zu begrenzen. Wenn Sie beispielsweise für Trennzeichen für Nullfeldwerte den Schrägstrich (/) festlegen, können Sie NULL/null/NUL/nul angeben, um anzugeben, dass jede dieser Zeichenfolgen einen Nullwert in dieser Spalte darstellen könnte.

  • Trennzeichen für Nullfeldwerte

    Dies ist eine abhängige Eigenschaft von Nullfeldwert. Sie können ein Trennzeichen angeben, das in der Eigenschaft Nullfeldwert verwendet werden kann, um einen Wertebereich anzugeben, der den Nullwert darstellen kann. Sie können eine Zahl, eine Zeichenfolge oder ein Literal-Escapezeichen des Typs C (wie für Nullfeldwert) als Trennzeichen angeben, ein einzelnes Zeichen, wie beispielsweise ein Komma (,) oder ein Schrägstrich (/), ist jedoch die beste Wahl. Sie müssen ein Trennzeichen nur angeben, wenn Sie für Nullfeldwert mehrere Werte angeben; wenn Sie ein Trennzeichen angeben, ohne es zu verwenden, hat dies einen Laufzeitfehler zur Folge.

  • Präfixbyte. Sie können diese Option für Felder variabler Länge verwenden. Felder variabler Länge können entweder durch ein Zeichen begrenzt werden oder ein 1-, 2-oder 4-Byte-Präfix vorangestellt werden, das die Feldlänge enthält. IBM DataStage liest das Längenpräfix, nimmt das Präfix aber nicht als separates Feld in das Dataset auf, das es aus der Datei liest.

    Diese Eigenschaft schließt sich gegenseitig aus mit den Eigenschaften 'Begrenzer', 'Quote' und 'Letzter Begrenzer', die standardmäßig verwendet werden.

  • Feld drucken. Diese Eigenschaft ist für die Verwendung beim Debuggen von Jobs vorgesehen. Stellen Sie sie so ein, dass IBM DataStage eine Nachricht für jedes gelesene Feld erzeugt. Die Nachricht hat das folgende Format:
    Importing N: D
    Dabei gilt:
    • N ist der Feldname.
    • D sind die importierten Daten des Felds. Nicht druckbaren Zeichen, die in D enthalten sind, wird ein Escapezeichen als Präfix vorangestellt und sie werden als C-Zeichenfolgeliterale ausgegeben; wenn das Feld binäre Daten enthält, wird es im Oktalformat ausgegeben.
  • Anführungszeichen. Gibt an, dass Felder variabler Länge in einfache Anführungszeichen, doppelte Anführungszeichen oder ein anderes Zeichen oder Zeichenpaar eingeschlossen werden sollen. Wählen Sie 'Einfach 'oder 'Doppelt' aus oder geben Sie ein Zeichen ein. Dies ist standardmäßig auf Anführungszeichen gesetzt.

    Beim Lesen ignoriert IBM DataStage das führende Anführungszeichen und liest alle Bytes bis zum abschließenden Anführungszeichen, aber nicht einschließlich des abschließenden Anführungszeichens.

  • Vektorpräfix. Für Felder, die Vektoren variabler Länge sind, angeben, dass ein 1-, 2-oder 4-Byte-Präfix die Anzahl der Elemente im Vektor enthält. Sie können dieses Standardpräfix für einzelne Vektoren überschreiben.

    Vektoren variabler Länge müssen entweder ein Präfix auf dem Vektor oder eine Verknüpfung zu einem anderen Feld verwenden, um die Anzahl der Elemente im Vektor anzugeben. Wenn dem Vektor variabler Länge ein Präfix vorangestellt ist, geben Sie mit dieser Eigenschaft die Präfixlänge an. IBM DataStage liest das Längenpräfix, nimmt es jedoch nicht als separates Feld in das Dataset auf. Standardmäßig wird angenommen, dass die Präfixlänge 1 Byte beträgt.

Typstandardwerte

Diese Eigenschaften gelten für alle Spalten eines bestimmten Datentyps, sofern sie nicht explizit auf Spaltenebene überschrieben werden. Sie sind gemäß dem Datentyp in eine Reihe von Untergruppen unterteilt.

Allgemein

Diese Eigenschaften gelten für mehrere Datentypen (sofern sie nicht auf Spaltenebene überschrieben werden):
  • Byteanordnung. Gibt an, wie mehrere Bytedatentypen (mit Ausnahme von Zeichenfolge- und Rohdatentypen) angeordnet werden. Folgende stehen zur Auswahl:
    • little-endian. Das höchstwertige Byte - High Byte - befindet sich auf der rechten Seite.
    • big-endian. Das höchstwertige Byte - High Byte - befindet sich auf der linken Seite.
    • native-endian. Wie durch das native Format des Geräts definiert. Dies ist die Standardeinstellung.
  • Datenformat. Gibt das Datendarstellungsformat eines Felds an. Gilt für Felder aller Datentypen mit Ausnahme von 'string', 'ustring' und 'raw' sowie Datensatzfelder, Unterdatensatzfelder oder mit Tags versehene Felder, die mindestens ein Feld enthalten, das weder den Typ 'string' noch den Typ 'raw' hat. Folgende stehen zur Auswahl:
    • Binär
    • text (Standardeinstellung)

      Die Einstellung 'binary' unterschiedliche Bedeutungen, wenn sie auf verschiedene Datentypen angewendet wird:

    • Für Dezimalzahlen hat 'binary' die Bedeutung 'gepackt'.
    • Für andere numerische Datentypen hat 'binary' die Bedeutung 'nicht Text'.
    • Für Datumsangaben ist 'binary' äquivalent zur Angabe der Eigenschaft 'julian' für das Datumsfeld.
    • Für die Uhrzeit ist 'binary' äquivalent zu 'midnight_seconds'.
    • Für Zeitmarken gibt 'binary' an, dass die erste ganze Zahl einen julianischen Tageszähler für den Datumsteil der Zeitmarke enthält und die zweite ganze Zahl den Zeitteil der Zeitmarke als die Anzahl Sekunden ab Mitternacht angibt. Eine binäre Zeitmarke gibt an, dass zwei 32-Bit-Ganzzahlen geschrieben werden.

      Standardmäßig werden Daten wie folgt als Text formatiert:

    • Für den Datentyp 'date' gibt 'text' an, dass die Daten, die gelesen werden, ein textbasiertes Datum im Format %yyyy-%mm-%dd oder im Standarddatumsformat enthalten, wenn Sie ein neues Format auf einem NLS-System definiert haben.
    • Für den Datentyp 'decimal' stellt ein Feld eine Dezimalzahl in einem Zeichenfolgeformat mit einem führenden Leerzeichen oder '-' gefolgt von Dezimalziffern mit einem eingebetteten Dezimalzeichen dar, wenn die Anzahl der Kommastellen nicht null ist. Das Zielzeichenfolgenformat lautet [+ | -]ddd.[ddd] und alle Argumente für die Genauigkeit und die Anzahl der Kommastellen werden ignoriert.
    • Für numerische Felder (int8, int16, int32, uint8, uint16, uint32, sfloat und dfloat): IBM DataStage geht davon aus, dass numerische Felder als Text dargestellt werden.
    • Für den Zeitdatentyp: text gibt an, dass das Feld Zeit im textbasierten Format %hh: %nn darstellt:%ss.
    • Für den Zeitmarkendatentyp: text gibt eine textbasierte Zeitmarke im Format %yyyy-%mm-%dd %hh: %nn:%ss an.
  • Max. Breite des Feldes. Die maximale Anzahl Byte in einer Spalte, die als Zeichenfolge dargestellt wird. Geben Sie eine Zahl ein. Dies ist nützlich, wenn Sie Zahlen als Text speichern. Wenn Sie einen Zeichensatz mit fester Breite verwenden, können Sie die Länge genau berechnen. Wenn Sie einen Zeichensatz mit variabler Länge verwenden, berechnen Sie eine ausreichende maximale Breite für Ihre Felder. Gilt für Felder aller Datentypen außer Datum, Uhrzeit, Zeitstempel und Rohwert; und für Datensatz, Unterdatensatz oder Mit Tag versehen, wenn diese mindestens ein Feld dieses Typs enthalten.
  • Feldbreite. Die Anzahl der Byte in einem Feld, die als Zeichenfolge dargestellt werden. Geben Sie eine Zahl ein. Dies ist nützlich, wenn Sie Zahlen als Text speichern. Wenn Sie einen Zeichensatz mit fester Breite verwenden, können Sie die Anzahl Byte exakt berechnen. Wenn es sich um eine Codierung variabler Länge handelt, basieren Sie Ihre Berechnung auf der Breite und Häufigkeit Ihrer Zeichen variabler Breite. Gilt für Felder aller Datentypen außer Datum, Uhrzeit, Zeitstempel und Rohwert; und für Datensatz, Unterdatensatz oder Mit Tag versehen, wenn diese mindestens ein Feld dieses Typs enthalten.

    Wenn Sie weder die Feldbreite noch die maximale Breite des Feldes angeben, haben numerische Felder, die als Text geschrieben werden, die folgende Anzahl Byte als maximale Breite:

    • 8-Bit-Ganzzahlen mit oder ohne Vorzeichen: 4 Byte
    • 16-Bit-Ganzzahlen mit oder ohne Vorzeichen: 6 Byte
    • 32-Bit-Ganzzahlen mit oder ohne Vorzeichen: 11 Byte
    • 64-Bit-Ganzzahlen mit oder ohne Vorzeichen: 21 Byte
    • Gleitkommazahl mit einfacher Genauigkeit: 14 Byte (Vorzeichen, Ziffer, Dezimalzeichen, 7 Bruchteil, "E", Vorzeichen, 2 Exponent)
    • Gleitkommazahl mit doppelter Genauigkeit: 24 Byte (Vorzeichen, Ziffer, Dezimalzeichen, 16 Bruchteil, "E", Zeichen, 3 Exponent)
  • Füllzeichen. Diese Eigenschaft wird für Ausgabelinks ignoriert.
  • Zeichensatz. Gibt den Zeichensatz an. Wählen Sie ASCII oder EBCDIC aus. Der Standardwert ist ASCII. Gilt für alle Datentypen mit Ausnahme von 'raw' und 'ustring' sowie für die Typen 'record', 'subrec' oder 'tagged', die ausschließlich Felder des Typs 'raw' oder 'ustring' enthalten.

Zeichenfolge

Diese Eigenschaften werden auf Spalten mit einem Zeichenfolgedatentyp angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • EBCDIC als ASCII exportieren. Für Ausgabelinks nicht relevant.
  • ASCII als EBCDIC importieren. Wählen Sie diese Option aus, um anzugeben, dass ASCII-Zeichen als EBCDIC-Zeichen gelesen werden sollen.

DECIMAL

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'decimal' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • Lauter Nullen zulassen. Gibt an, ob eine gepackte Dezimalspalte, die ausschließlich Nullen enthält (normalerweise nicht zulässig), als gültige Darstellung von Null behandelt werden soll oder nicht. Wählen Sie Ja oder Nein. Der Standardwert ist 'Nein'.
  • Dezimaltrennzeichen. Geben Sie das ASCII-Zeichen an, das als Dezimaltrennzeichen dient (standardmäßig der Punkt).
  • Gepackt. Wählen Sie eine Option aus, um anzugeben, was die dezimalen Spalten enthalten. Gültige Auswahlmöglichkeiten sind:
    • 'Ja', um anzugeben, dass die Dezimalfelder Daten im gepackten Dezimalformat enthalten (Standardeinstellung). Diese Eigenschaft hat die folgenden Untereigenschaften:

      Überprüfen. Wählen Sie 'Ja' aus, um zu überprüfen, ob die Daten gepackt sind; wählen Sie 'Nein', um die Überprüfung zu überspringen.

      Mit Vorzeichen. Wählen Sie 'Ja' aus, um beim Lesen von Dezimalfeldern das vorhandene Vorzeichen zu verwenden. Wählen Sie 'Nein' aus, um unabhängig vom tatsächlichen Vorzeichenwert des Felds ein positives Vorzeichen (0xf) zu schreiben.

    • Wählen Sie 'Nein (separat)' aus, um anzugeben, dass nicht gepackte Dezimalzahlen mit einem separaten Vorzeichenbyte enthalten sind. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

    • Nein (gezont), um anzugeben, dass eine nicht gepackte Dezimalzahl in ASCII-oder EBCDIC-Textformat enthalten ist. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

    • Wählen Sie Nein (Overpunch) aus, um anzugeben, dass das Feld ein vorangestelltes oder abschließendes Byte hat, das ein Zeichen enthält, das sowohl den numerischen Wert dieses Byte angibt als auch, ob die Zahl als Ganzes mit negativem oder positivem Vorzeichen versehen ist. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

  • Genauigkeit. Gibt die Genauigkeit einer gepackten Dezimalzahl an. Geben Sie eine Zahl ein.
  • Rundung. Gibt an, wie das Quellfeld gekürzt oder aufgefüllt werden soll, damit es beim Lesen eines Quellenfeldes auf eine Dezimalzahl in die Zieldezimalzahl passt. Folgende stehen zur Auswahl:
    • Aufrunden (obere Grenze). Die Spalte "Quelle" in eine positive Unendlichkeit kürzen. Dieser Modus entspricht dem Aufrundungsmodus IEEE 754. Beispiel: Aus 1,4 wird 2, aus -1,6 wird -1.
    • Abrunden (untere Grenze). Die Spalte "Quelle" in eine negative Unendlichkeit kürzen. Dieser Modus entspricht dem Abrundungsmodus IEEE 754. Beispiel: Aus 1,6 wird 1, aus -1,4 wird -2.
    • Nächstliegender Wert. Runden Sie die Spalte "Quelle" auf den nächsten darstellbaren Wert auf oder ab. Dieser Modus entspricht dem COBOL-Modus GERUNDET. Beispiel: Aus 1,4 wird 1, aus 1,5 wird 2, aus -1,4 wird -1, aus -1,5 wird -2.
    • Nachkommastellen abschneiden. Dies ist die Standardeinstellung. Alle Nachkommastellen rechts von der äußersten rechten Nachkommastelle, die im Ziel unterstützt wird, unabhängig vom Vorzeichen verwerfen. Ist das Ziel beispielsweise eine Ganzzahl, werden alle Nachkommastellen entfernt. Wenn das Ziel eine andere Dezimalzahl mit einer kleineren Dezimalstellen-Angabe ist, wird auf die Anzahl der Kommastellen der Zieldezimalzahl gekürzt. Dieser Modus entspricht der COBOL-Funktion INTEGER-PART. Bei dieser Methode wird 1.6 zu 1, -1.6 wird zu -1.
  • Nachkommastellen. Gibt die Nachkommastellen einer Quelle für gepackte Dezimalzahlen an.

Numerisch

Diese Eigenschaften gelten für Felder für ganze Zahlen (Integer) und für Gleitkommafelder, sofern sie nicht auf Spaltenebene überschrieben werden.
  • C-Format. Führen Sie eine vom Standard abweichende Konvertierung von Daten aus Zeichenfolgedaten in eine Ganzzahl oder Gleitkommazahl durch. Diese Eigenschaft gibt eine Zeichenfolge im Format der Programmiersprache C an, die zum Lesen von Ganzzahlzeichenfolgen oder Gleitkommazeichenfolgen verwendet wird. Diese Zeichenfolge wird an sscanf() übergeben. Wenn Sie beispielsweise ein C-Format von %x und eine Feldbreite von 8 angeben, wird sichergestellt, dass eine 32-Bit-Ganzzahl als hexadezimale 8-Byte-Zeichenfolge formatiert wird.
  • Eingabeformat. Formatzeichenfolge, die für die Konvertierung von Daten aus einer Zeichenfolge in Ganzzahl-oder Gleitkommadaten verwendet wird. Diese wird an SSCANF() übergeben. Standardmäßig startet IBM DataStage die Funktion C SSCANF(), um ein als Zeichenfolge formatiertes numerisches Feld in Ganzzahl-oder Gleitkommadaten zu konvertieren. Wenn diese Funktion keine Daten in einem zufriedenstellenden Format ausgibt, können Sie die Eigenschaft 'Eingabeformat' angeben, um Formatierungsargumente an sscanf() zu übergeben.
  • Ausgabeformat. Diese Eigenschaft ist für Ausgabelinks nicht relevant.

Date

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'date' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden. Alle diese Eigenschaften sind mit der Einstellung 'Text' für das Datenformat nicht kompatibel.
  • Tage seit. Datumsangaben werden als signierte Ganzzahl geschrieben, die die Anzahl der Tage seit dem angegebenen Datum enthält. Geben Sie ein Datum im Format %yyyy-%mm-%dd oder im Standarddatumsformat ein, wenn Sie auf einem NLS-System ein neues Format definiert haben.
  • Formatzeichenfolge. Das Zeichenfolgeformat eines Datums. Standardmäßig ist dies %yyyy-%mm-%dd.
  • Julianisch. Wählen Sie diese Option aus, um anzugeben, dass Datumsangaben als numerischer Wert geschrieben werden, der den julianischen Tag enthält. Ein Julianischer Tag gibt das Datum als die Anzahl der Tage ab 4713 BCE Januar 1, 12:00 Uhr (Mittag) an. GMT.

Zeit

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'time' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden. Alle diese Eigenschaften sind mit der Einstellung 'Text' für das Datenformat nicht kompatibel.
  • Formatzeichenfolge. Gibt das Format der Spalten an, die die Uhrzeit als Zeichenfolge darstellen. Standardmäßig ist dies %hh-%mm-%ss.
  • Sekunden ab Mitternacht. Wählen Sie diese Option aus, um anzugeben, dass Uhrzeiten als binäre 32-Bit-Ganzzahl geschrieben werden, die die Anzahl Sekunden enthält, die seit Mitternacht verstrichen sind.

Zeitmarke

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'timestamp' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • Formatzeichenfolge. Gibt das Format einer Spalte an, die eine Zeitmarke als Zeichenfolge darstellt. Das Format kombiniert das Format für Datumszeichenfolgen und Zeitzeichenfolgen.