DataStage 에서 데이터 파티셔닝 및 수집
마지막 업데이트 날짜: 2025년 3월 12일
스테이지 또는 커넥터가 데이터를 처리하거나 데이터 대상에 쓰기 전에 현재 링크에서 데이터를 파티션하거나 수집하는 방법에 대한 세부사항을 지정하려면 입력 탭이 있는 DataStage® 스테이지 또는 커넥터의 파티셔닝 섹션을 사용하십시오.
데이터 파티셔닝은 레코드 세트를 파티션 또는 레코드 서브세트로 구분하는 병렬 처리에 대한 접근 방식입니다. 자원 제약조건이나 다른 데이터 왜곡 문제가 없는 경우, 데이터 파티셔닝하면 애플리케이션 성능이 비례적으로 증가할 수 있습니다. DataStage 는 스테이지에 필요한 파티션 유형에 따라 자동으로 데이터를 파티션합니다.
또한 파티셔닝 섹션을 사용하여 데이터를 처리하거나 이를 데이터 대상에 쓰기 전에 입력 링크에 도달하는 데이터를 정렬할 수도 있습니다. 정렬이 사용 가능한지 여부는 선택한 파티셔닝 또는 수집 방법에 따라 다릅니다. 자동 방법의 경우 정렬을 사용할 수 없습니다. 파티셔닝 섹션은 기본 정렬 기능을 제공합니다. 더 복잡한 정렬 오퍼레이션의 경우 정렬 스테이지를 사용하십시오.
파티셔닝 섹션에는 다음의 제어 및 필드가 포함되어 있습니다.
- 파티셔닝
- 목록에서 파티셔닝 유형을 선택하십시오.
- 수집 중
- 목록에서 수집 유형을 선택하십시오.
- 정렬
- 해당 제어를 사용하여 데이터의 정렬 방법을 지정할 수 있습니다. 데이터는 항상 데이터 파티션 내에서 정렬됩니다. 스테이지에서 수신 데이터를 파티셔닝하는 경우 데이터는 파티셔닝 후에 정렬됩니다. 스테이지가 수신 데이터를 수집하는 경우 콜렉션 전에 데이터가 정렬됩니다.
- 정렬
- 링크에 참여하는 데이터를 정렬하려면 정렬 수행을 선택하십시오.
- 안정
- 이전에 정렬된 데이터 세트를 유지하려면 안정을 선택하십시오. 기본값은 안정입니다.
- 고유
- 정렬 키 값마다 하나의 레코드만 보유하려면 고유를 선택하십시오. 다수의 레코드에 동일한 정렬 키 값이 있으면 하나를 제외한 모두가 제거됩니다. 안정 정렬도 설정된 경우, 정렬 키 값의 첫 번째 레코드는 보유 중인 레코드입니다.
DataStage 동적으로 생성된 구성 파일
DataStage 사용자가 생성한 구성 파일을 지원하지 않습니다. 런타임 환경에서 파티션 수를 설정하거나 환경 변수 ' APT_WLM_PARTITION_COUNT
'을 파티션 수로 설정하여 동적으로 생성된 구성 파일의 파티션 수를 제공할 수 있습니다.
주제가 도움이 되었습니까?
0/1000