집계 단계: 계산 및 재계산 종속 속성(DataStage®)
일부 특성은 계산을 위한 컬럼 및 재계산을 위한 요약 컬럼의 종속 특성입니다.
다음은 결과를 전달할 다양한 집계 함수 및 출력 컬럼을 지정합니다.
- 수정된 제곱합
집계 컬럼의 데이터에 대해 수정된 제곱합을 생성하고 지정된 출력 컬럼에 출력합니다.
- 최대값
집계 컬럼의 최대값을 제공하고 지정된 출력 컬럼에 출력합니다.
- 평균 값
집계 컬럼의 평균 값을 제공하고 지정된 출력 컬럼에 출력합니다.
- 최소값
집계 컬럼의 최소값을 제공하고 지정된 출력 컬럼에 출력합니다.
- 누락된 값
"누락된" 값을 구성하는 항목(예: -1 또는 널)을 지정합니다. 값을 부동 소수점 숫자로 입력하십시오. 재계산을 위한 요약 컬럼에는 사용할 수 없습니다.
- 누락된 값 개수
누락된 값이 포함된 집계 컬럼 수를 계산하고 지정된 출력 컬럼에 개수를 출력합니다. 다시 계산할 수 없습니다.
- 누락되지 않은 값 개수
값이 포함된 집계 컬럼 수를 계산하고 지정된 출력 컬럼에 개수를 출력합니다.
- 변동 계수(%)
집계 컬럼의 변동 계수(%)를 계산하고 지정된 출력 컬럼에 출력합니다.
- Range
집계 컬럼의 값 범위를 계산하고 지정된 출력 컬럼에 출력합니다.
- 표준 편차
집계 컬럼의 값 표준 편차를 계산하고 지정된 출력 컬럼에 출력합니다.
- 표준 오차
집계 컬럼의 값 표준 오차를 계산하고 지정된 출력 컬럼에 출력합니다.
- 가중치 합계
가중치 컬럼 특성에 지정된 가중치 컬럼의 값 합계를 계산하고 지정된 출력 컬럼에 출력합니다.
- Sum
집계 컬럼의 값을 합산하고 지정된 출력 컬럼에 합계를 출력합니다.
- 요약
계산 또는 재계산 오퍼레이션의 결과를 기록할 서브레코드를 지정합니다.
- 수정되지 않은 제곱합
집계 컬럼의 데이터에 대해 수정되지 않은 제곱합을 생성하고 지정된 출력 컬럼에 출력합니다.
- 분산
집계 컬럼의 분산을 계산하고 지정된 출력 컬럼에 합계를 출력합니다. 이 특성에는 다음 종속 특성이 있습니다.
- 편차 약수
편차 약수를 지정합니다. 기본적으로 그룹의 레코드 수에서 누락된 값이 있는 레코드 수를 뺀 값에서 1을 뺀을 값을 사용하여 분산을 계산합니다. 이것은 기본값인 vardiv 설정에 해당합니다. NRecs를 지정할 경우, IBM DataStage에서는 그룹의 레코드 수에서 누락된 값이 있는 레코드 수를 뺀 값을 대신 사용합니다.
- 편차 약수
이러한 특성 각각에는 다음과 같은 종속 특성이 있습니다.
- 10진수 출력
기본적으로 모든 계산 또는 재계산 컬럼의 출력 유형은 double입니다. 이 특성을 사용하여 컬럼의 출력 유형을 10진수로 지정할 수 있습니다.
10진수 출력을 지정할 때 정밀도 및 스케일을 지정할 수도 있습니다. 정밀도는 숫자의 자릿수입니다. 스케일은 숫자의 소수점 오른쪽에 있는 자릿수입니다. 기본값은
8,2
입니다.필요한 출력 스케일이 낮을 경우 정확한 결과를 얻기 위해 정밀도와 스케일을 p+4, s+4로 설정하십시오. 컬럼의 정밀도와 스케일이
4,1
인 경우, 10진수 데이터 유형에서 정밀도와 스케일을9,5
(으)로 설정하십시오.예:
다른 감소 옵션의 중간 계산에 10진수유형을 사용할 수 있습니다. 10진수정밀도 및 스케일은 중간 계산의 반올림을 피할 수 있도록 충분히 크게 설정해야 합니다. 예를 들어, 크기 정밀도가 8이고 스케일이 2인 10진수의 평균값을 계산하는 경우 중간 10진수크기는 최소한 정밀도 10과 스케일 4로 설정되어야 합니다." 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0"
값을 보유한 컬럼. 컬럼의 정밀도 값은4
이며, 스케일 값은1
입니다. 정밀도와 스케일이9,5
(으)로 설정된 경우 출력은 7.8로 계산됩니다. 그러나 정밀도와 스케일이4,1
(으)로 설정된 경우 출력은 7.9입니다. 더 정확한 계산은 7.8입니다.