기계 번역된 주제 영어 버전으로 전환할 수 있음

본 문서의 가장 정확하고 최신 버전은 영어(원본) 버전을 참조하십시오. IBM은 자동으로 기계 번역된 컨텐츠를 사용하여 발생하는 피해 또는 손실에 대해 책임을 지지 않습니다.

마스킹 플로우 작업 실행

마지막 업데이트 날짜: 2025년 1월 28일

마스킹 플로우 작업 실행

마스킹 플로우 작업에서 데이터 사용자는 마스크된 데이터 사본의 대상 목적지를 정의합니다. 작업을 스케줄할 수 있으며 작업이 완료되면 작업 보고서 요약을 볼 수 있습니다.

마스킹 플로우 작업을 작성하는 두 가지 방법이 있습니다.

참고: 마스킹 흐름 작업 중 작업을 지원할 메모리가 충분하지 않으면 오류가 발생할 수 있습니다. 오류를 방지하기 위해 데이터의 최대 크기는 12GB보다 클 수 없습니다.

마스크 플로우 환경 만들기

환경 템플릿을 생성하려면 다음 두 가지 조건이 모두 충족되어야 합니다

프로젝트에 대한 환경 템플릿을 생성하려면:

프로젝트에서 관리 탭을 클릭한 다음 환경 페이지를 클릭합니다.
환경 페이지에서 템플릿 탭을 클릭한 다음, 새 템플릿을 클릭합니다.
이름과 설명(선택 사항)을 입력하여 환경 세부 사항을 정의합니다.
유형 에서 스파크를 클릭합니다.
하드웨어 구성 에서 마스킹 플로우 작업의 테이블 크기에 따라 드라이버와 실행기 구성을 지정합니다.
실행자 수 아래에서 실행자 수를 늘리면 작업이 파티션으로 실행되도록 구성되었을 때 마스킹 흐름의 성능이 향상됩니다. 더 자세한 정보는 업무 성과 관리 항목 의 우수 사례 섹션을 참고하세요.
소프트웨어 버전 목록 에서 Masking Flow Spark를 선택합니다.
작성을 클릭하십시오.

작업을 구성하려면:

작업의 이름을 입력하고 작업의 선택적 설명을 추가하십시오.
마스크된 데이터 사본을 삽입할 대상 연결을 추가하십시오. 소스 연결은 데이터를 읽는 데 사용됩니다.
새 연결을 추가하려면 +를 클릭하십시오. 스키마는 소스 테이블을 대상 테이블에 맵핑합니다. 테이블 정의는 대상 스키마에 이미 구성되어 있어야 합니다.

팁: 소스 자산이 Apache Hive 경우 Apache HDFS 대상 연결로 사용합니다.

(선택 사항) 파티션 페이지에서 선택 사항으로 자산의 파티션 세부 사항을 편집할 수 있습니다:
- 샘플링 설정을 사용하여 마스킹 플로우를 생성하는 경우, 파티션 세부사항 편집을 끄기로 설정하여 파티션 페이지 편집을 무시해도 됩니다.
- 데이터가 많은 테이블이 있는 경우, 열을 파티션 열로 지정하여 파티션 세부 사항을 편집하는 것을 고려해 보십시오. 작업 수행 능력을 향상시키기 위해 파티션의 수를 늘릴 수 있습니다. 더 자세한 정보를 원하시면, 업무 성과 관리 항목 의 우수 사례 부분을 참고하시기 바랍니다.
(선택사항) 작업을 스케줄하거나 반복 작업을 스케줄하십시오.
작업을 검토하고 실행합니다.