0 / 0

집계 단계: 계산 및 재계산 종속 속성(DataStage®)

마지막 업데이트 날짜: 2025년 3월 12일
DataStage의 Aggregator 스테이지: 계산 및 재계산 종속 특성

일부 특성은 계산을 위한 컬럼 및 재계산을 위한 요약 컬럼의 종속 특성입니다.

다음은 결과를 전달할 다양한 집계 함수 및 출력 컬럼을 지정합니다.

  • 수정된 제곱합

    집계 컬럼의 데이터에 대해 수정된 제곱합을 생성하고 지정된 출력 컬럼에 출력합니다.

  • 최대값

    집계 컬럼의 최대값을 제공하고 지정된 출력 컬럼에 출력합니다.

  • 평균 값

    집계 컬럼의 평균 값을 제공하고 지정된 출력 컬럼에 출력합니다.

  • 최소값

    집계 컬럼의 최소값을 제공하고 지정된 출력 컬럼에 출력합니다.

  • 누락된 값

    "누락된" 값을 구성하는 항목(예: -1 또는 널)을 지정합니다. 값을 부동 소수점 숫자로 입력하십시오. 재계산을 위한 요약 컬럼에는 사용할 수 없습니다.

  • 누락된 값 개수

    누락된 값이 포함된 집계 컬럼 수를 계산하고 지정된 출력 컬럼에 개수를 출력합니다. 다시 계산할 수 없습니다.

  • 누락되지 않은 값 개수

    값이 포함된 집계 컬럼 수를 계산하고 지정된 출력 컬럼에 개수를 출력합니다.

  • 변동 계수(%)

    집계 컬럼의 변동 계수(%)를 계산하고 지정된 출력 컬럼에 출력합니다.

  • Range

    집계 컬럼의 값 범위를 계산하고 지정된 출력 컬럼에 출력합니다.

  • 표준 편차

    집계 컬럼의 값 표준 편차를 계산하고 지정된 출력 컬럼에 출력합니다.

  • 표준 오차

    집계 컬럼의 값 표준 오차를 계산하고 지정된 출력 컬럼에 출력합니다.

  • 가중치 합계

    가중치 컬럼 특성에 지정된 가중치 컬럼의 값 합계를 계산하고 지정된 출력 컬럼에 출력합니다.

  • Sum

    집계 컬럼의 값을 합산하고 지정된 출력 컬럼에 합계를 출력합니다.

  • 요약

    계산 또는 재계산 오퍼레이션의 결과를 기록할 서브레코드를 지정합니다.

  • 수정되지 않은 제곱합

    집계 컬럼의 데이터에 대해 수정되지 않은 제곱합을 생성하고 지정된 출력 컬럼에 출력합니다.

  • 분산

    집계 컬럼의 분산을 계산하고 지정된 출력 컬럼에 합계를 출력합니다. 이 특성에는 다음 종속 특성이 있습니다.

    • 편차 약수

      편차 약수를 지정합니다. 기본적으로 그룹의 레코드 수에서 누락된 값이 있는 레코드 수를 뺀 값에서 1을 뺀을 값을 사용하여 분산을 계산합니다. 이것은 기본값인 vardiv 설정에 해당합니다. NRecs를 지정할 경우, IBM DataStage에서는 그룹의 레코드 수에서 누락된 값이 있는 레코드 수를 뺀 값을 대신 사용합니다.

이러한 특성 각각에는 다음과 같은 종속 특성이 있습니다.

  • 10진수 출력

    기본적으로 모든 계산 또는 재계산 컬럼의 출력 유형은 double입니다. 이 특성을 사용하여 컬럼의 출력 유형을 10진수로 지정할 수 있습니다.

    10진수 출력을 지정할 때 정밀도 및 스케일을 지정할 수도 있습니다. 정밀도는 숫자의 자릿수입니다. 스케일은 숫자의 소수점 오른쪽에 있는 자릿수입니다. 기본값은 8,2입니다.

    필요한 출력 스케일이 낮을 경우 정확한 결과를 얻기 위해 정밀도와 스케일을 p+4, s+4로 설정하십시오. 컬럼의 정밀도와 스케일이 4,1인 경우, 10진수 데이터 유형에서 정밀도와 스케일을 9,5(으)로 설정하십시오.

    예: " 004.0"," 010.0"," 004.0"," 006.0"," 010.0"," 008.0"," 009.0"," 007.0" " 010.0"," 007.0"," 010.0"," 007.0"," 010.0" 값을 보유한 컬럼. 컬럼의 정밀도 값은 4이며, 스케일 값은 1입니다. 정밀도와 스케일이 9,5(으)로 설정된 경우 출력은 7.8로 계산됩니다. 그러나 정밀도와 스케일이 4,1(으)로 설정된 경우 출력은 7.9입니다. 더 정확한 계산은 7.8입니다.

    다른 감소 옵션의 중간 계산에 10진수유형을 사용할 수 있습니다. 10진수정밀도 및 스케일은 중간 계산의 반올림을 피할 수 있도록 충분히 크게 설정해야 합니다. 예를 들어, 크기 정밀도가 8이고 스케일이 2인 10진수의 평균값을 계산하는 경우 중간 10진수크기는 최소한 정밀도 10과 스케일 4로 설정되어야 합니다.