영어 버전 문서로 돌아가기
DataStage 스테이지
DataStage 단계
마지막 업데이트 날짜: 2025년 3월 12일
DataStage® 플로우는 데이터 소스에서 데이터 대상으로의 데이터 플로우를 설명하는 함께 링크된 스테이지로 구성됩니다. 스테이지는 데이터 소스, 처리 단계 또는 대상 시스템을 설명합니다. 또한 스테이지는 입력 링크에서 출력 링크로 데이터를 이동하는 처리 논리를 정의합니다.
스테이지 기능
한 스테이지에는 보통 하나 이상의 데이터 입력 또는 하나의 데이터 출력이 있습니다. 그러나 일부 스테이지의 경우 둘 이상의 데이터 입력을 허용하고 둘 이상의 스테이지에 출력할 수 있습니다. 다음 표에서는 사용 가능한 스테이지를 나열하고 해당 기능에 대한 세부사항을 제공합니다.
스테이지 | 아이콘 | 함수 |
---|---|---|
Aggregator | 수신 데이터를 그룹으로 분류하고, 각 그룹에 대해 총계 및 기타 요약 함수를 계산하고, 이를 작업의 다른 스테이지에 전달합니다. | |
Bloom Filter | 이전 값에 대한 수신 키를 찾습니다. | |
Change Apply | 변경된 데이터 세트를 기준으로 인코딩된 변경 오퍼레이션을 이전 데이터 세트에 적용합니다. 이전 및 이후 데이터 세트는 변경사항 캡처 스테이지에서 가져옵니다. | |
Change Capture | 두 개의 데이터 세트를 비교하여 차이점을 기록합니다. | |
Checksum | 행의 지정된 컬럼에서 체크섬 값을 생성하고 이 체크섬을 행에 추가합니다. | |
Column Export | 서로 다른 데이터 유형의 다수의 컬럼에서 데이터 유형 ustring, string 또는 binary의 단일 컬럼으로 데이터를 내보냅니다. | |
Column Generator | 수신 데이터에 열을 추가하고 처리된 각 데이터 행에 대해 이러한 열의 모의 데이터를 생성합니다. | |
Column Import | 하나의 열에서 데이터를 가져와 하나 이상의 열에 출력합니다. | |
Combine Records | 특정 키 컬럼 값이 동일한 레코드를 하위 레코드의 벡터에 결합합니다. | |
Compare | 사전에 정렬된 두 입력 데이터 세트에 있는 레코드의 열별 비교를 수행합니다. | |
Compress | UNIX compress 또는 GZIP 유틸리티를 사용하여 데이터 세트를 압축합니다. 이 스테이지는 레코드 시퀀스의 데이터 세트를 원시 2진 데이터 스트림으로 변환합니다. | |
Copy | 하나의 입력 데이터 세트를 여러 출력 데이터 세트에 복사합니다. | |
Decode | 사용자가 제공하는 UNIX 디코딩 명령을 사용하여 데이터 세트를 디코딩합니다. | |
Difference | 동일한 데이터 세트의 서로 다른 버전인 두 입력 데이터 세트의 레코드별 비교를 수행합니다. | |
Distributed Transaction | 여러 데이터 소스에서 트랜잭션을 실행합니다. | |
Encode | 사용자가 제공하는 UNIX 인코딩 명령을 사용하여 데이터 세트를 인코딩합니다. | |
Expand | UNIX uncompress 또는 GZIP 유틸리티를 사용하여 데이터 세트를 압축 해제합니다. 이 스테이지는 이전에 압축된 데이터 세트를 원시 2진 데이터 스트림에서 다시 레코드 시퀀스로 변환합니다. | |
External Filter | 처리하는 데이터에 대한 필터 역할을 하는 UNIX 명령을 지정할 수 있도록 합니다. | |
Filter | 지정된 요구사항을 충족하는 입력 데이터 세트의 레코드를 미수정 상태로 전송하고, 다른 모든 레코드는 필터로 걸러냅니다. | |
Funnel | 여러 입력 데이터 세트를 하나의 출력 데이터 세트에 복사합니다. | |
Generic | 작업에 Orchestrate ® Operator를 통합합니다. | |
Head | 입력 데이터 세트의 각 파티션에서 처음 N개 레코드를 선택하고 선택한 레코드를 출력 데이터 세트에 복사합니다. | |
Join | 스테이지에 대한 둘 이상의 데이터 세트 입력에 대해 결합 오퍼레이션을 수행한 후 결과 데이터 세트를 출력합니다. | |
Lookup | 데이터를 출력할 수 있는 다른 병렬 작업 스테이지로부터 메모리로 읽은 데이터 세트, 또는 참조 출력 링크를 지원하는 데이터베이스 스테이지 중 하나에 의해 제공된 데이터 세트에 대해 검색 오퍼레이션을 수행하는 데 사용됩니다. 이는 또한 파일 세트 검색 스테이지에 포함된 검색 테이블의 검색을 수행할 수도 있습니다. | |
Make Subrecords | 입력 데이터 세트에 있는 지정된 벡터를 열에 원본 벡터의 이름 및 데이터 유형이 있는 서브레코드의 벡터로 결합합니다. | |
Make Vector | 입력 데이터 레코드의 지정된 컬럼을 컬럼의 벡터에 결합합니다. | |
Merge | 정렬된 마스터 데이터 세트를 하나 이상의 정렬된 업데이트 데이터 세트와 결합합니다. | |
Modify | 입력 데이터 세트의 레코드 스키마를 변경합니다. | |
Peek | 스테이지가 입력 데이터 세트의 레코드를 하나 이상의 출력 데이터 세트로 복사할 때 레코드 컬럼 값을 작업 로그 또는 별도의 출력 링크로 인쇄합니다. | |
Pivot Enterprise | Pivot Enterprise 스테이지는 데이터를 가로 및 세로로 피벗팅하는 처리 스테이지입니다. 수평 피벗팅은 입력 행의 컬럼 세트를 여러 출력 행의 단일 컬럼에 맵핑합니다. 수직 피벗팅은 입력 데이터의 행 세트를 단일 또는 다중 출력 열에 맵핑합니다. |
|
Promote Subrecords | 입력 서브레코드의 열을 최상위 레벨 열로 승격시킵니다. | |
Remove Duplicates | 하나의 정렬된 데이터 세트를 입력으로 받아 모든 중복 레코드를 제거하고 결과를 출력 데이터 세트에 기록합니다. | |
Row Generator | 지정된 메타데이터에 맞는 모의 데이터 세트를 생성합니다. | |
Sample | 입력 데이터 세트를 샘플링합니다. | |
Slowly Changing Dimension (SCD) | 스타 스키마 데이터베이스의 컨텍스트 내에서 작업하여 시간 경과에 따라 현재 및 히스토리 데이터를 저장하고 관리합니다. | |
Sort | 입력 열을 정렬합니다. | |
Split Subrecord | 입력 서브레코드 필드를 최상위 레벨 벡터 컬럼 세트로 분리합니다. | |
Split Vector | 고정 길이 벡터 요소를 유사한 이름의 최상위 레벨 열 세트로 승격시킵니다. | |
Surrogate Key Generator stage | 대리 키 컬럼을 생성하고 키 소스를 유지보수합니다. | |
Switch | 하나의 데이터 세트를 입력받아, 각 입력 레코드를 선택기 필드의 값에 따라 출력 데이터 세트에 지정합니다. | |
Tail | 입력 데이터 세트의 각 파티션에서 마지막 N개 레코드를 선택하고 선택한 레코드를 출력 데이터 세트에 복사합니다. | |
Transformer | 추출된 데이터를 처리하고, 필요한 변환을 수행하며, 다른 활성 스테이지 또는 대상 데이터베이스나 파일에 데이터를 기록하는 스테이지로 데이터를 전달합니다. | |
Wave Generator | 데이터 스트림을 모니터링하고 필요한 경우 EOW(End-Of-Wave) 마커를 삽입합니다. | |
Web Service | DataStage 플로우 또는 작업 내의 웹 서비스 조작에 액세스합니다. | |
Write Range Map | 범위 맵에 데이터를 기록합니다. 이 스테이지에는 하나의 입력 링크가 있을 수 있습니다. |
이 일련의 비디오를 보고 가장 일반적인 단계를 사용하는 방법을 확인하십시오.
주제가 도움이 되었습니까?
0/1000