0 / 0
Zurück zur englischen Version der Dokumentation

Aggregatorstufe: Berechnung und Neuberechnung von Eigenschaften (DataStage®)

Letzte Aktualisierung: 12. März 2025
Stage 'Aggregator' in DataStage: Von der Berechnung und Neuberechnung abhängige Eigenschaften

Einige Eigenschaften sind sowohl von der Spalte für Berechnung als auch von der Zusammenfassungsspalte für Neuberechnung abhängig.

Diese geben die verschiedenen Aggregatfunktionen und die Ausgabespalten für die Ergebnisse an.

  • Korrigierte Summe der Quadrate

    Erstellt eine korrigierte Summe der Quadrate für Daten in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.

  • Maximalwert

    Gibt den Maximalwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.

  • Mittelwert

    Gibt den Mittelwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.

  • Minimalwert

    Gibt den Minimalwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.

  • Fehlender Wert

    Gibt an, was einen "fehlenden" Wert darstellt, beispielsweise -1 oder NULL. Geben Sie den Wert als Gleitkommazahl ein. Nicht verfügbar für Zusammenfassungsspalte für Neuberechnung.

  • Anzahl fehlender Werte

    Gibt die Anzahl Aggregatspalten an, in denen Werte fehlen, und gibt die Zahl an die angegebene Ausgabespalte aus. Nicht verfügbar für Neuberechnung.

  • Anzahl nicht fehlender Werte

    Gibt die Anzahl Aggregatspalten an, die Werte enthalten, und gibt die Zahl an die angegebene Ausgabespalte aus.

  • Prozentualer Variationskoeffizient

    Berechnet den prozentualen Variationskoeffizienten für die Aggregatspalte und gibt diesen an die angegebene Ausgabespalte aus.

  • Range

    Berechnet den Wertebereich in der Aggregatspalte und gibt ihn an die angegebene Ausgabespalte aus.

  • Standardabweichung

    Berechnet die Standardabweichung der Werte in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.

  • Standardfehler

    Berechnet den Standardfehler der Werte in der Aggregatspalte und gibt ihn an die angegebene Ausgabespalte aus.

  • Summe der Gewichtungen

    Berechnet die Summe der Werte in der Gewichtungsspalte, die durch die Spalteneigenschaft 'Weight' angegeben wird, und gibt sie an die angegebene Ausgabespalte aus.

  • Summe

    Summiert die Werte in der Aggregatspalte und gibt die Summe an die angegebene Ausgabespalte aus.

  • Zusammenfassung

    Gibt einen Unterdatensatz an, in den die Ergebnisse der Berechnungs- oder Neuberechnungsoperation geschrieben werden sollen.

  • Nicht korrigierte Summe der Quadrate

    Erzeugt eine nicht korrigierte Summe der Quadrate für Daten in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.

  • Varianz

    Berechnet die Varianz für die Aggregatspalte und gibt die Summe an die angegebene Ausgabespalte aus. Diese Eigenschaft hat eine abhängige Eigenschaft:

    • Varianzdivisor

      Gibt den Varianzdivisor an. Standardmäßig wird ein Wert der Anzahl Datensätze in der Gruppe abzüglich der Anzahl Datensätze mit fehlenden Werten minus 1 verwendet, um die Varianz zu berechnen. Dies entspricht der Einstellung 'Default' (Standard) für vardiv. Wenn Sie 'NRecs' angeben, verwendet IBM DataStage stattdessen die Anzahl Datensätze in der Gruppe abzüglich der Anzahl Datensätze mit fehlenden Werten.

Jede dieser Eigenschaften hat die folgende abhängige Eigenschaft:

  • Dezimalausgabe

    Standardmäßig haben alle Berechnungs- oder Neuberechnungsspalten den Ausgabetyp 'double'. Mit dieser Eigenschaft können Sie angeben, dass Spalten den Ausgabetyp 'decimal' haben.

    Wenn Sie die dezimale Ausgabe angeben, können Sie auch die Genauigkeit und die Nachkommastellen angeben. Genauigkeit ist die Anzahl von Ziffern (Stellen) in einer Zahl. Nachkommastellen ist die Anzahl von Ziffern (Stellen) rechts vom Komma einer Dezimalzahl. Der Standardwert ist 8,2.

    In Fällen, in denen der erforderliche Umfang der Ausgabe gering ist, legen Sie für Genauigkeit (p, precision) und Nachkommastellen (s, scale) die Werte p+4, s+4 fest, um genaue Ergebnisse zu erhalten. Wenn eine Spalte die Genauigkeit und die Anzahl der Kommastellen 4,1 aufweist, setzen Sie im Dezimaldatentyp die Genauigkeit und die Anzahl der Kommastellen auf 9,5.

    Beispiel für eine Spalte mit den Werten: " 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0". Der Genauigkeitswert für die Spalte ist 4 und der Maßstabswert ist 1. Die Ausgabe wird als 7.8 berechnet, wenn die Genauigkeit und der Maßstab auf 9,5 gesetzt sind. Wenn die Genauigkeit und der Maßstab jedoch auf 4,1 gesetzt sind, lautet die Ausgabe 7.9. Die genauere Berechnung ist 7,8.

    Sie können den Dezimaltyp für Zwischenberechnungen der verschiedenen Verkleinerungsoptionen verwenden. Die Dezimalgenauigkeit und der Maßstab sollten groß genug sein, um die Rundung von Zwischenberechnungen zu vermeiden. Wenn Sie beispielsweise den Mittelwert einer Dezimalzahl mit der Größengenauigkeit 8 und der Anzahl der Kommastellen 2 berechnen, sollte die mittlere Dezimalgröße auf mindestens die Genauigkeit 10 und die Anzahl der Kommastellen 4 gesetzt werden.