영어 버전 문서로 돌아가기
DataStage의 블룸 필터 스테이지: 스테이지 탭
블룸 필터 스테이지: 스테이지 탭(DataStage®)
마지막 업데이트 날짜: 2025년 3월 12일
블룸 필터 스테이지 탭에서는 블룸 필터 스테이지의 여러 측면을 제어할 수 있습니다.
스테이지를 두 번 클릭하면 스테이지 특성 패널이 열립니다. 특성 섹션에서는 스테이지에서 수행하는 작업을 지정할 수 있습니다. 고급 섹션에서는 스테이지 실행 방법을 지정할 수 있습니다. 스테이지에 대한 설명은 선택적으로 지정하십시오.
특성 섹션
특성 및 옵션 섹션에서는 스테이지에서 실제로 수행하는 작업을 정의할 수 있습니다.
- 모드
- 작성 또는 처리를 선택하십시오. 모드 특성은 기본적으로 작성으로 설정됩니다.
- 작성
- 이 옵션은 스테이지가 작성 모드로 실행되도록 지정합니다. 입력 데이터 세트의 키는 블룸 필터에 추가되고 데이터 세트의 마지막 레코드 다음에 메모리에 기록됩니다. 이 옵션은
-process
모드에서 블룸 필터를 사용하는 향후 작업에서 결국 사용될 이전 정적 데이터의 블룸 필터를 작성하는 데 사용될 수 있습니다. - 프로세스
- 이 옵션은 스테이지가 프로세스 모드로 실행되도록 지정합니다. 입력 데이터 세트의 키는 메모리에 로드된 블룸 필터에 대해 검색됩니다.
- 파일 세트
- 블룸 필터 정보를 저장하는 데 사용되는 파일 세트의 경로와 이름을 지정하십시오.
- 크기
- 블룸 필터에 삽입할 고유 항목 수를 지정하십시오. 이 옵션의 값을 지정할 때 총 항목 수를 여유 있게 추정하십시오.
- 편집
- 키를 지정하려면 편집을 클릭하십시오. 이 옵션은
-create
또는-process
옵션 중 하나로 검색에 사용할 키를 지정합니다. 최소한 하나의-key
이(가) 필요합니다. - 추가 특성(작성)
- 날짜: 이 옵션은 수신 데이터 세트가 연관된 yyyy-mm-dd 형식의 날짜 문자열을 지정합니다. 이 숫자는 오래된 필터를 삭제하는 데 사용되는 연관된 블룸 필터의 파일 이름에 추가됩니다. 작성 모드에서 이 옵션을 지정하지 않으면
-previous_days
옵션을 프로세스 모드에서 사용할 수 없습니다. - 단계: 이 옵션은 각 키 그룹이 생성할 해시 인덱스 수를 지정합니다. 단계 수가 많을수록 거짓 긍정 백분율은 낮아지지만 메모리 요구사항은 증가합니다. 사용하는 단계 수는 정적 필터 작성에 사용된 단계 수와 일치해야 합니다.
- 자르기: 이 옵션은 파일 세트를 자릅니다.
- 날짜: 이 옵션은 수신 데이터 세트가 연관된 yyyy-mm-dd 형식의 날짜 문자열을 지정합니다. 이 숫자는 오래된 필터를 삭제하는 데 사용되는 연관된 블룸 필터의 파일 이름에 추가됩니다. 작성 모드에서 이 옵션을 지정하지 않으면
- 추가 특성(프로세스)
- 날짜: 이 옵션은 수신 데이터 세트가 연관된 yyyy-mm-dd 형식의 날짜 문자열을 지정합니다. 이 숫자는 오래된 필터를 삭제하는 데 사용되는 연관된 블룸 필터의 파일 이름에 추가됩니다. 작성 모드에서 이 옵션을 지정하지 않으면 -previous_days 옵션을 프로세스 모드에서 사용할 수 없습니다.
- 이전 필터 삭제: 이 옵션은 -previous_days 계수 이전의 블룸 필터가 파일 세트에서 제거됨을 지정합니다.
- 중복 플래그: 이 옵션은 스테이지를 실행할 때 중복 플래그를 지정하도록 지정합니다.
- 단계: 이 옵션은 각 키 그룹이 생성할 해시 인덱스 수를 지정합니다. 단계 수가 많을수록 거짓 긍정 백분율은 낮아지지만 메모리 요구사항은 증가합니다. 사용하는 단계 수는 정적 필터 작성에 사용된 단계 수와 일치해야 합니다.
- 이전 날짜: 이 옵션은 검색에 사용할 이전 블룸 필터의 일 수를 지정합니다. 지정하지 않을 경우 기존 필터가 모두 사용됩니다.
- 참조 날짜: 이 옵션은 -previous_days 옵션의 참조 날짜입니다. yyyy-mm-dd 형식으로 이 변수를 지정하십시오.
- 자르기: 이 옵션은 파일 세트를 자릅니다.
고급 특성
고급 특성 섹션에서는 다음 옵션을 지정할 수 있습니다.- 실행 모드. 이 스테이지는 병렬 모드 또는 순차 모드로 실행될 수 있습니다. 병렬 모드에서는 입력 데이터 세트가 구성 파일에 지정된 사용 가능한 노드에서 처리되고 고급 섹션에 지정된 노드 제한조건에 따라 처리됩니다. 순차 모드에서는 전체 데이터 세트가 컨덕터 노드에서 처리됩니다.
- 결합 모드. 기본값은 자동이며, 이 경우 IBM DataStage에서는 병렬 스테이지의 기반이 되는 연산자를 결합하여 이 유형의 스테이지에 적합한 경우 동일한 프로세스에서 실행되도록 합니다.
- 파티셔닝 유지. 기본값은 설정입니다. 설정 또는 해제 중에서 선택할 수 있습니다. 설정을 선택하면 작업의 다음 스테이지에서 파티셔닝을 유지하도록 스테이지에서 요청합니다.
주제가 도움이 되었습니까?
0/1000