0 / 0
영어 버전 문서로 돌아가기

DataStage에서 차이 단계

마지막 업데이트 날짜: 2025년 3월 12일
DataStage 의 차이 스테이지

차이 스테이지는 이전 및 이후 데이터 세트로 지정된 동일한 데이터 세트의 서로 다른 버전인 두 개의 입력 데이터 세트에 대해 레코드별 비교를 수행합니다.

Difference 스테이지는 처리 스테이지입니다. 레코드 간의 차이를 나타내는 단일 데이터 세트를 출력합니다. 이 스테이지는 입력 데이터 세트가 Difference 스테이지 비교에 지정되는 키 열에 대해 키로 파티션되고 오름차순으로 정렬되는 것으로 가정합니다. 이는 Sort 스테이지를 사용하거나 Difference 스테이지의 내장 정렬 및 파티셔닝 기능을 사용하여 수행할 수 있습니다.

비교는 디퍼런스 키 열 세트를 기반으로 수행됩니다. 모든 디퍼런스 키 값이 동일한 경우 두 레코드는 서로의 사본입니다. 선택적으로 변경 값을 지정할 수도 있습니다. 두 레코드에 동일한 키 열이 있는 경우, 값 열을 비교하여 한 열이 다른 열의 편집된 사본인지 확인할 수 있습니다.

차이점 단계는 DataStage에서 캡처 단계 변경하기에 설명된 캡처 변경 단계와 유사하지만 동일하지는 않습니다. Change Capture 스테이지는 Change Apply 스테이지와 함께 사용하기 위한 것입니다. Change Capture 스테이지는 사후 데이터 세트로 전환하기 위해 사전 데이터 세트에 적용해야 하는 변경사항을 포함하는 변경 데이터 세트를 생성합니다. 차이 스테이지는 이전 행과 이후 행을 출력 데이터 세트에 출력하고 차이가 있는지 여부를 나타내는 코드를 출력합니다. 이전 및 이후 데이터의 컬럼 이름이 동일한 경우, 하나의 데이터 세트가 다른 데이터 세트를 효과적으로 겹쳐쓰므로 출력에 하나의 컬럼 세트만 표시됩니다. 출력되는 데이터 세트는 스테이지 탭의 링크 순서 섹션에 있는 설정으로 제어됩니다. 이전이후 데이터 세트의 컬럼 이름이 다른 경우, 출력 탭에서 컬럼을 편집할 때 두 데이터 세트의 컬럼을 맵핑 옵션으로 설정된 대로 출력할 수 있습니다. 입력 데이터 세트에서 키 또는 값 컬럼으로 지정된 컬럼은 이름이 동일해야 합니다.

차이 스테이지를 두 번 클릭하면 특성 패널이 열립니다. 특성 패널에는 다음 세 가지 탭이 있습니다.

  • 스테이지. 이 페이지는 항상 표시되며 스테이지에 대한 일반 정보를 지정하는 데 사용됩니다.
  • 입력. 그룹화 또는 집계할 데이터에 대한 세부사항을 지정할 있습니다.
  • 출력. 스테이지에서 출력할 그룹에 대한 세부사항을 지정할 수 있습니다.

입력 탭

컬럼 섹션은 수신 데이터의 컬럼 정의를 지정합니다. 고급 탭에서는 입력 링크의 기본 버퍼링 설정을 변경할 수 있습니다.

출력 탭

차이 스테이지에는 하나의 출력 링크만 있을 수 있습니다.

컬럼 탭은 데이터의 컬럼 정의를 지정합니다. 차이 스테이지에 입력되는 컬럼과 출력 컬럼 간의 관계를 지정하려면 컬럼 섹션의 맨 아래에 있는 편집을 클릭하십시오. 고급 섹션에서는 출력 링크의 기본 버퍼링 설정을 변경할 수 있습니다.