Aggregatorstufe: Berechnung und Neuberechnung von Eigenschaften (DataStage®)
Einige Eigenschaften sind sowohl von der Spalte für Berechnung als auch von der Zusammenfassungsspalte für Neuberechnung abhängig.
Diese geben die verschiedenen Aggregatfunktionen und die Ausgabespalten für die Ergebnisse an.
- Korrigierte Summe der Quadrate
Erstellt eine korrigierte Summe der Quadrate für Daten in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.
- Maximalwert
Gibt den Maximalwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.
- Mittelwert
Gibt den Mittelwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.
- Minimalwert
Gibt den Minimalwert in der Aggregatspalte an und gibt ihn an die angegebene Ausgabespalte aus.
- Fehlender Wert
Gibt an, was einen "fehlenden" Wert darstellt, beispielsweise -1 oder NULL. Geben Sie den Wert als Gleitkommazahl ein. Nicht verfügbar für Zusammenfassungsspalte für Neuberechnung.
- Anzahl fehlender Werte
Gibt die Anzahl Aggregatspalten an, in denen Werte fehlen, und gibt die Zahl an die angegebene Ausgabespalte aus. Nicht verfügbar für Neuberechnung.
- Anzahl nicht fehlender Werte
Gibt die Anzahl Aggregatspalten an, die Werte enthalten, und gibt die Zahl an die angegebene Ausgabespalte aus.
- Prozentualer Variationskoeffizient
Berechnet den prozentualen Variationskoeffizienten für die Aggregatspalte und gibt diesen an die angegebene Ausgabespalte aus.
- Range
Berechnet den Wertebereich in der Aggregatspalte und gibt ihn an die angegebene Ausgabespalte aus.
- Standardabweichung
Berechnet die Standardabweichung der Werte in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.
- Standardfehler
Berechnet den Standardfehler der Werte in der Aggregatspalte und gibt ihn an die angegebene Ausgabespalte aus.
- Summe der Gewichtungen
Berechnet die Summe der Werte in der Gewichtungsspalte, die durch die Spalteneigenschaft 'Weight' angegeben wird, und gibt sie an die angegebene Ausgabespalte aus.
- Summe
Summiert die Werte in der Aggregatspalte und gibt die Summe an die angegebene Ausgabespalte aus.
- Zusammenfassung
Gibt einen Unterdatensatz an, in den die Ergebnisse der Berechnungs- oder Neuberechnungsoperation geschrieben werden sollen.
- Nicht korrigierte Summe der Quadrate
Erzeugt eine nicht korrigierte Summe der Quadrate für Daten in der Aggregatspalte und gibt sie an die angegebene Ausgabespalte aus.
- Varianz
Berechnet die Varianz für die Aggregatspalte und gibt die Summe an die angegebene Ausgabespalte aus. Diese Eigenschaft hat eine abhängige Eigenschaft:
- Varianzdivisor
Gibt den Varianzdivisor an. Standardmäßig wird ein Wert der Anzahl Datensätze in der Gruppe abzüglich der Anzahl Datensätze mit fehlenden Werten minus 1 verwendet, um die Varianz zu berechnen. Dies entspricht der Einstellung 'Default' (Standard) für vardiv. Wenn Sie 'NRecs' angeben, verwendet IBM DataStage stattdessen die Anzahl Datensätze in der Gruppe abzüglich der Anzahl Datensätze mit fehlenden Werten.
- Varianzdivisor
Jede dieser Eigenschaften hat die folgende abhängige Eigenschaft:
- Dezimalausgabe
Standardmäßig haben alle Berechnungs- oder Neuberechnungsspalten den Ausgabetyp 'double'. Mit dieser Eigenschaft können Sie angeben, dass Spalten den Ausgabetyp 'decimal' haben.
Wenn Sie die dezimale Ausgabe angeben, können Sie auch die Genauigkeit und die Nachkommastellen angeben. Genauigkeit ist die Anzahl von Ziffern (Stellen) in einer Zahl. Nachkommastellen ist die Anzahl von Ziffern (Stellen) rechts vom Komma einer Dezimalzahl. Der Standardwert ist
8,2
.In Fällen, in denen der erforderliche Umfang der Ausgabe gering ist, legen Sie für Genauigkeit (p, precision) und Nachkommastellen (s, scale) die Werte p+4, s+4 fest, um genaue Ergebnisse zu erhalten. Wenn eine Spalte die Genauigkeit und die Anzahl der Kommastellen
4,1
aufweist, setzen Sie im Dezimaldatentyp die Genauigkeit und die Anzahl der Kommastellen auf9,5
.Beispiel für eine Spalte mit den Werten:
Sie können den Dezimaltyp für Zwischenberechnungen der verschiedenen Verkleinerungsoptionen verwenden. Die Dezimalgenauigkeit und der Maßstab sollten groß genug sein, um die Rundung von Zwischenberechnungen zu vermeiden. Wenn Sie beispielsweise den Mittelwert einer Dezimalzahl mit der Größengenauigkeit 8 und der Anzahl der Kommastellen 2 berechnen, sollte die mittlere Dezimalgröße auf mindestens die Genauigkeit 10 und die Anzahl der Kommastellen 4 gesetzt werden." 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0"
. Der Genauigkeitswert für die Spalte ist4
und der Maßstabswert ist1
. Die Ausgabe wird als 7.8 berechnet, wenn die Genauigkeit und der Maßstab auf9,5
gesetzt sind. Wenn die Genauigkeit und der Maßstab jedoch auf4,1
gesetzt sind, lautet die Ausgabe 7.9. Die genauere Berechnung ist 7,8.