마스킹 플로우 작업 실행
마지막 업데이트 날짜: 2025년 1월 28일
마스킹 플로우 작업에서 데이터 사용자는 마스크된 데이터 사본의 대상 목적지를 정의합니다. 작업을 스케줄할 수 있으며 작업이 완료되면 작업 보고서 요약을 볼 수 있습니다.
마스킹 플로우 작업을 작성하는 두 가지 방법이 있습니다.
- 마스킹 플로우를 작성한 후 작업 구성을 클릭하십시오.
- 개별 데이터 자산의 옵션 메뉴를 클릭하여 마스킹 플로우 작성을 건너뛰고 해당 데이터 자산에 대한 마스킹 작업을 직접 구성하십시오.
참고: 마스킹 흐름 작업 중 작업을 지원할 메모리가 충분하지 않으면 오류가 발생할 수 있습니다. 오류를 방지하기 위해 데이터의 최대 크기는 12GB보다 클 수 없습니다.
마스크 플로우 환경 만들기
필요 권한
환경 템플릿을 생성하려면 다음 두 가지 조건이 모두 충족되어야 합니다
- 프로젝트에 대한 관리자 또는 편집자 역할이 있어야 합니다.
- 프로젝트 생성자의 IBM Cloud 계정에 속해 있어야 합니다.
프로젝트에 대한 환경 템플릿을 생성하려면:
- 프로젝트에서 관리 탭을 클릭한 다음 환경 페이지를 클릭합니다.
- 환경 페이지에서 템플릿 탭을 클릭한 다음, 새 템플릿을 클릭합니다.
- 이름과 설명(선택 사항)을 입력하여 환경 세부 사항을 정의합니다.
- 유형 에서 스파크를 클릭합니다.
- 하드웨어 구성 에서 마스킹 플로우 작업의 테이블 크기에 따라 드라이버와 실행기 구성을 지정합니다.
- 실행자 수 아래에서 실행자 수를 늘리면 작업이 파티션으로 실행되도록 구성되었을 때 마스킹 흐름의 성능이 향상됩니다. 더 자세한 정보는 업무 성과 관리 항목 의 우수 사례 섹션을 참고하세요.
- 소프트웨어 버전 목록 에서 Masking Flow Spark를 선택합니다.
- 작성을 클릭하십시오.
작업 작업
작업을 구성하려면:
- 작업의 이름을 입력하고 작업의 선택적 설명을 추가하십시오.
- 마스크된 데이터 사본을 삽입할 대상 연결을 추가하십시오. 소스 연결은 데이터를 읽는 데 사용됩니다.
- 새 연결을 추가하려면 +를 클릭하십시오. 스키마는 소스 테이블을 대상 테이블에 맵핑합니다. 테이블 정의는 대상 스키마에 이미 구성되어 있어야 합니다.
팁: 소스 자산이 Apache Hive 경우 Apache HDFS 대상 연결로 사용합니다.
- (선택 사항) 파티션 페이지에서 선택 사항으로 자산의 파티션 세부 사항을 편집할 수 있습니다:
- 샘플링 설정을 사용하여 마스킹 플로우를 생성하는 경우, 파티션 세부사항 편집을 끄기로 설정하여 파티션 페이지 편집을 무시해도 됩니다.
- 데이터가 많은 테이블이 있는 경우, 열을 파티션 열로 지정하여 파티션 세부 사항을 편집하는 것을 고려해 보십시오. 작업 수행 능력을 향상시키기 위해 파티션의 수를 늘릴 수 있습니다. 더 자세한 정보를 원하시면, 업무 성과 관리 항목 의 우수 사례 부분을 참고하시기 바랍니다.
- (선택사항) 작업을 스케줄하거나 반복 작업을 스케줄하십시오.
- 작업을 검토하고 실행합니다.
자세한 정보
상위 주제: 마스킹 흐름으로 데이터 마스킹
주제가 도움이 되었습니까?
0/1000