0 / 0
영어 버전 문서로 돌아가기

DataStage 단계

마지막 업데이트 날짜: 2025년 3월 12일
DataStage 스테이지

DataStage® 플로우는 데이터 소스에서 데이터 대상으로의 데이터 플로우를 설명하는 함께 링크된 스테이지로 구성됩니다. 스테이지는 데이터 소스, 처리 단계 또는 대상 시스템을 설명합니다. 또한 스테이지는 입력 링크에서 출력 링크로 데이터를 이동하는 처리 논리를 정의합니다.

스테이지 기능

한 스테이지에는 보통 하나 이상의 데이터 입력 또는 하나의 데이터 출력이 있습니다. 그러나 일부 스테이지의 경우 둘 이상의 데이터 입력을 허용하고 둘 이상의 스테이지에 출력할 수 있습니다. 다음 표에서는 사용 가능한 스테이지를 나열하고 해당 기능에 대한 세부사항을 제공합니다.

표 1. 스테이지
스테이지 아이콘 함수
Aggregator 집계기 아이콘 수신 데이터를 그룹으로 분류하고, 각 그룹에 대해 총계 및 기타 요약 함수를 계산하고, 이를 작업의 다른 스테이지에 전달합니다.
Bloom Filter 블룸 필터 아이콘 이전 값에 대한 수신 키를 찾습니다.
Change Apply 변경 적용 아이콘 변경된 데이터 세트를 기준으로 인코딩된 변경 오퍼레이션을 이전 데이터 세트에 적용합니다. 이전 및 이후 데이터 세트는 변경사항 캡처 스테이지에서 가져옵니다.
Change Capture 캡처 변경 아이콘 두 개의 데이터 세트를 비교하여 차이점을 기록합니다.
Checksum 체크섬 아이콘 행의 지정된 컬럼에서 체크섬 값을 생성하고 이 체크섬을 행에 추가합니다.
Column Export 체크섬 아이콘 서로 다른 데이터 유형의 다수의 컬럼에서 데이터 유형 ustring, string 또는 binary의 단일 컬럼으로 데이터를 내보냅니다.
Column Generator 열 생성기 아이콘 수신 데이터에 열을 추가하고 처리된 각 데이터 행에 대해 이러한 열의 모의 데이터를 생성합니다.
Column Import 열 가져오기 아이콘 하나의 열에서 데이터를 가져와 하나 이상의 열에 출력합니다.
Combine Records 레코드 결합 아이콘 특정 키 컬럼 값이 동일한 레코드를 하위 레코드의 벡터에 결합합니다.
Compare 비교 아이콘 사전에 정렬된 두 입력 데이터 세트에 있는 레코드의 열별 비교를 수행합니다.
Compress 압축 아이콘 UNIX compress 또는 GZIP 유틸리티를 사용하여 데이터 세트를 압축합니다. 이 스테이지는 레코드 시퀀스의 데이터 세트를 원시 2진 데이터 스트림으로 변환합니다.
Copy 복사 아이콘 하나의 입력 데이터 세트를 여러 출력 데이터 세트에 복사합니다.
Decode 디코드 아이콘 사용자가 제공하는 UNIX 디코딩 명령을 사용하여 데이터 세트를 디코딩합니다.
Difference 차이 아이콘 동일한 데이터 세트의 서로 다른 버전인 두 입력 데이터 세트의 레코드별 비교를 수행합니다.
Distributed Transaction 분산 트랜잭션 아이콘 여러 데이터 소스에서 트랜잭션을 실행합니다.
Encode 인코드 아이콘 사용자가 제공하는 UNIX 인코딩 명령을 사용하여 데이터 세트를 인코딩합니다.
Expand 펼치기 아이콘 UNIX uncompress 또는 GZIP 유틸리티를 사용하여 데이터 세트를 압축 해제합니다. 이 스테이지는 이전에 압축된 데이터 세트를 원시 2진 데이터 스트림에서 다시 레코드 시퀀스로 변환합니다.
External Filter 외부 필터 아이콘 처리하는 데이터에 대한 필터 역할을 하는 UNIX 명령을 지정할 수 있도록 합니다.
Filter 필터 아이콘 지정된 요구사항을 충족하는 입력 데이터 세트의 레코드를 미수정 상태로 전송하고, 다른 모든 레코드는 필터로 걸러냅니다.
Funnel 퍼널 아이콘 여러 입력 데이터 세트를 하나의 출력 데이터 세트에 복사합니다.
Generic 일반 아이콘 작업에 Orchestrate ® Operator를 통합합니다.
Head 헤드 아이콘 입력 데이터 세트의 각 파티션에서 처음 N개 레코드를 선택하고 선택한 레코드를 출력 데이터 세트에 복사합니다.
Join 결합 아이콘 스테이지에 대한 둘 이상의 데이터 세트 입력에 대해 결합 오퍼레이션을 수행한 후 결과 데이터 세트를 출력합니다.
Lookup 검색 아이콘 데이터를 출력할 수 있는 다른 병렬 작업 스테이지로부터 메모리로 읽은 데이터 세트, 또는 참조 출력 링크를 지원하는 데이터베이스 스테이지 중 하나에 의해 제공된 데이터 세트에 대해 검색 오퍼레이션을 수행하는 데 사용됩니다. 이는 또한 파일 세트 검색 스테이지에 포함된 검색 테이블의 검색을 수행할 수도 있습니다.
Make Subrecords 아이콘 입력 데이터 세트에 있는 지정된 벡터를 열에 원본 벡터의 이름 및 데이터 유형이 있는 서브레코드의 벡터로 결합합니다.
Make Vector 벡터 작성 아이콘 입력 데이터 레코드의 지정된 컬럼을 컬럼의 벡터에 결합합니다.
Merge 병합 아이콘 정렬된 마스터 데이터 세트를 하나 이상의 정렬된 업데이트 데이터 세트와 결합합니다.
Modify 수정 아이콘 입력 데이터 세트의 레코드 스키마를 변경합니다.
Peek 피크 아이콘 스테이지가 입력 데이터 세트의 레코드를 하나 이상의 출력 데이터 세트로 복사할 때 레코드 컬럼 값을 작업 로그 또는 별도의 출력 링크로 인쇄합니다.
Pivot Enterprise 피벗 엔터프라이즈 아이콘

Pivot Enterprise 스테이지는 데이터를 가로 및 세로로 피벗팅하는 처리 스테이지입니다.

수평 피벗팅은 입력 행의 컬럼 세트를 여러 출력 행의 단일 컬럼에 맵핑합니다.

수직 피벗팅은 입력 데이터의 행 세트를 단일 또는 다중 출력 열에 맵핑합니다.

Promote Subrecords 서브레코드 승격 아이콘 입력 서브레코드의 열을 최상위 레벨 열로 승격시킵니다.
Remove Duplicates 중복 제거 아이콘 하나의 정렬된 데이터 세트를 입력으로 받아 모든 중복 레코드를 제거하고 결과를 출력 데이터 세트에 기록합니다.
Row Generator 행 생성기 아이콘 지정된 메타데이터에 맞는 모의 데이터 세트를 생성합니다.
Sample 샘플 아이콘 입력 데이터 세트를 샘플링합니다.
Slowly Changing Dimension (SCD) 정렬 아이콘 스타 스키마 데이터베이스의 컨텍스트 내에서 작업하여 시간 경과에 따라 현재 및 히스토리 데이터를 저장하고 관리합니다.
Sort 정렬 아이콘 입력 열을 정렬합니다.
Split Subrecord 서브레코드 분할 아이콘 입력 서브레코드 필드를 최상위 레벨 벡터 컬럼 세트로 분리합니다.
Split Vector 벡터 분할 아이콘 고정 길이 벡터 요소를 유사한 이름의 최상위 레벨 열 세트로 승격시킵니다.
Surrogate Key Generator stage 대리 키 생성기 아이콘 대리 키 컬럼을 생성하고 키 소스를 유지보수합니다.
Switch 전환 아이콘 하나의 데이터 세트를 입력받아, 각 입력 레코드를 선택기 필드의 값에 따라 출력 데이터 세트에 지정합니다.
Tail 꼬리 아이콘 입력 데이터 세트의 각 파티션에서 마지막 N개 레코드를 선택하고 선택한 레코드를 출력 데이터 세트에 복사합니다.
Transformer Transformer 아이콘 추출된 데이터를 처리하고, 필요한 변환을 수행하며, 다른 활성 스테이지 또는 대상 데이터베이스나 파일에 데이터를 기록하는 스테이지로 데이터를 전달합니다.
Wave Generator 웨이브 생성기 아이콘 데이터 스트림을 모니터링하고 필요한 경우 EOW(End-Of-Wave) 마커를 삽입합니다.
Web Service 웹 서비스 아이콘 DataStage 플로우 또는 작업 내의 웹 서비스 조작에 액세스합니다.
Write Range Map 범위 맵 쓰기 아이콘 범위 맵에 데이터를 기록합니다. 이 스테이지에는 하나의 입력 링크가 있을 수 있습니다.

이 일련의 비디오를 보고 가장 일반적인 단계를 사용하는 방법을 확인하십시오.