アグリゲーター・ステージ:計算および再計算に依存するプロパティ (DataStage®)
一部のプロパティーは、計算列と、再計算の集計列の両方に依存しています。
これらは、さまざまな集約関数と結果を実行する出力列を指定します。
- 修正された平方和
集約列のデータの修正された平方和を生成し、指定された出力列に出力します。
- 最大値
集約列の最大値を示し、指定された出力列に出力します。
- 平均値
集約列の平均値を示し、指定された出力列に出力します。
- 最小値
集約列の最小値を示し、それを指定された出力列に出力します。
- 欠損値
これは、「欠損している」値 (-1 または NULLなど) を構成するものを指定します。 値を浮動小数点数で入力します。 集計列は再計算に使用できません。
- 欠損値カウント
欠損値がある集約列の数をカウントし、指定された出力列にカウントを出力します。 再計算に使用できません。
- 欠損していない値のカウント
欠損していない値を持つ集約列の数をカウントし、指定された出力列にカウントを出力します。
- 変動係数 (%)
集約列の変動係数を計算し、指定された出力列に出力します。
- 範囲
集約列の値の範囲を計算し、指定された出力列に出力します。
- 標準偏差
集約列の値の標準偏差を計算し、指定された出力列に出力します。
- 標準誤差
集約列の値の標準誤差を計算し、指定された出力列に出力します。
- ウェイトの合計
「ウェイト」列プロパティーで指定されたウェイト列の値の合計を計算し、指定された出力列に出力します。
- 合計 (Sum)
集約列の値を合計し、指定された出力列に合計を出力します。
- サマリー
計算の結果を書き込むサブレコード、または操作の再計算を行うサブレコードを指定します。
- 修正されていない平方和
集約列内のデータの未修正平方和を生成し、指定された出力列に出力します。
- 分散 (Variance)
集約列の差異を計算し、指定された出力列に合計を出力します。 これには従属プロパティーがあります。
- 差異除数
差異除数を指定します。 デフォルトでは、欠損値のあるレコードの数から 1 を引いた値を、グループ内のレコード数の値から引いた値が、差異を計算するために使用されます。 これは、デフォルトの vardiv 設定に対応します。 NRecs を指定すると、IBM DataStage は、グループ内のレコード数から、値が欠落しているレコードの数を引いた数を代わりに使用します。
- 差異除数
これらの各プロパティーには、以下の従属プロパティーがあります。
- 10 進数出力
デフォルトでは、すべての計算列または再計算列の出力タイプは double です。 このプロパティーを使用すると、列の出力タイプが 10 進数であることを指定できます。
10 進数を指定する場合は、精度とスケールを指定することもできます。 精度 は、数値の桁数です。 スケール は、数値の小数点の右側の桁数です。 デフォルトは
8,2
です。必要な出力スケールが低い場合は、精度を設定し、p+4、s+4 にスケールを設定し、正確な結果を得るようにしてください。 列の精度と位取りが
4,1
の場合は、10進データ・タイプで、精度と位取りを9,5
に設定します。例えば、
さまざまな削減オプションの中間計算に 10 進数タイプを使用できます。 小数部の精度と位取りは、中間計算の丸めを避けるために十分な大きさに設定する必要があります。 例えば、サイズ精度 8 および位取り 2 の 10 進数の平均値を計算する場合、中間 10 進数サイズは少なくとも精度 10 および位取り 4 に設定する必要があります。" 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0"
という値を持つ列があるとします 列の精度値は4
で、スケール値は1
です。 精度と位取りが9,5
に設定されている場合、出力は、7.8として計算されます。 ただし、精度と位取りが4,1
に設定されている場合、出力は7.9になります。 より正確な計算では 7.8 になります。