0 / 0
영어 버전 문서로 돌아가기

DataStage에서 집계자 단계

마지막 업데이트 날짜: 2025년 3월 12일
DataStage의 Aggregator 스테이지

Aggregator 스테이지는 단일 입력 링크의 데이터 행을 그룹으로 분류하고 각 그룹의 총계 또는 기타 집계 함수를 계산합니다. 각 그룹의 총계는 출력 링크를 통해 스테이지에서 출력됩니다.

Aggregator 스테이지를 두 번 클릭하면 특성 패널이 열립니다. 특성 패널에는 다음 세 가지 탭이 있습니다.

  • 스테이지. 이 페이지는 항상 표시되며 스테이지에 대한 일반 정보를 지정하는 데 사용됩니다.
  • 입력. 그룹화 또는 집계할 데이터에 대한 세부사항을 지정할 있습니다.
  • 출력. 스테이지에서 출력할 그룹에 대한 세부사항을 지정할 수 있습니다.

입력 탭

컬럼 섹션은 수신 데이터의 컬럼 정의를 지정합니다. 고급 섹션에서는 입력 링크의 기본 버퍼링 설정을 변경할 수 있습니다.

출력 탭

집계기 스테이지는 입력 데이터를 전송하지 않으며, 대신 새 열을 생성합니다. Aggregator 스테이지는 널 입력 가능 필드를 출력하므로 출력 데이터를 수신하는 컬럼은 널 입력 가능해야 합니다.

컬럼 섹션은 수신 데이터의 컬럼 정의를 지정합니다. 맵핑 정보를 지정하려면 컬럼 섹션의 맨 아래에 있는 편집을 클릭하십시오. 맵핑은 Aggregator 스테이지에서 생성할 처리된 데이터와 출력 컬럼 간의 관계를 지정합니다. 고급 섹션에서는 출력 링크의 기본 버퍼링 설정을 변경할 수 있습니다.

집계기 스테이지는 그룹화 및 요약 오퍼레이션에 대한 액세스를 제공합니다. 콜렉션 내의 패턴을 노출하는 가장 쉬운 방법 중 하나는 유사한 특성을 가진 레코드를 그룹화한 후 그룹 내의 모든 레코드에 대한 통계를 계산하는 것입니다. 그 후 이러한 통계를 사용하여 서로 다른 그룹의 특성을 비교할 수 있습니다. 예를 들어, 금전 등록기 거래를 포함하는 레코드는 거래 수가 가장 많았던 날, 가장 많은 이익이 발생한 날 등을 보기 위해 주중 요일별로 그룹화할 수 있습니다.

레코드는 하나 이상의 특성으로 그룹화될 수 있으며, 여기서 레코드 특성은 열 값에 대응합니다. 즉, 그룹은 하나 이상의 열에 대해 값이 동일한 레코드의 세트입니다. 예를 들어, 거래 레코드는 주중 요일별 및 월별 모두로 그룹화될 수 있습니다. 이러한 그룹은 계절별로 가장 바빴던 날을 보여줄 수 있습니다.

데이터에 있는 패턴을 드러내는 것 외에, 그룹화는 각 그룹으로 레코드를 요약하여 데이터의 양을 줄일 수 있으며, 이는 관리를 용이하게 합니다. 하나 이상의 데이터 특성을 기반으로 대량의 데이터를 그룹화하면 결과 데이터 세트가 일반적으로 원본보다 훨씬 작으므로 표준 도구를 사용하여 분석하기가 더 쉽습니다.

새 스테이지를 작성할 때 작업에 정렬 스테이지를 사용할지 아니면 추가 집계 스테이지를 사용할지 여부를 고려하는 것이 중요합니다.

Aggregator 스테이지에서 작업을 올바르게 실행하려면 각 입력 열이 올바른 유형의 출력 열에 맵핑되어 있는지 확인하십시오. 널 입력 가능 값이 예 또는 아니오인 입력 열은 동일한 값을 가진 출력 열에 맵핑되어야 합니다.

DataStage® Aggregator 스테이지를 사용하여 작업하는 방법에 대한 예제를 보려면 다음 비디오를 보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.