마스킹 플로우 작업 실행

마지막 업데이트 날짜: 2025년 1월 28일
마스킹 플로우 작업 실행

마스킹 플로우 작업에서 데이터 사용자는 마스크된 데이터 사본의 대상 목적지를 정의합니다. 작업을 스케줄할 수 있으며 작업이 완료되면 작업 보고서 요약을 볼 수 있습니다.

마스킹 플로우 작업을 작성하는 두 가지 방법이 있습니다.

  • 마스킹 플로우를 작성한 후 작업 구성을 클릭하십시오.
  • 개별 데이터 자산의 옵션 메뉴를 클릭하여 마스킹 플로우 작성을 건너뛰고 해당 데이터 자산에 대한 마스킹 작업을 직접 구성하십시오.
참고: 마스킹 흐름 작업 중 작업을 지원할 메모리가 충분하지 않으면 오류가 발생할 수 있습니다. 오류를 방지하기 위해 데이터의 최대 크기는 12GB보다 클 수 없습니다.

마스크 플로우 환경 만들기

필요 권한

환경 템플릿을 생성하려면 다음 두 가지 조건이 모두 충족되어야 합니다

  • 프로젝트에 대한 관리자 또는 편집자 역할이 있어야 합니다.
  • 프로젝트 생성자의 IBM Cloud 계정에 속해 있어야 합니다.

프로젝트에 대한 환경 템플릿을 생성하려면:

  1. 프로젝트에서 관리 탭을 클릭한 다음 환경 페이지를 클릭합니다.
  2. 환경 페이지에서 템플릿 탭을 클릭한 다음, 새 템플릿을 클릭합니다.
  3. 이름과 설명(선택 사항)을 입력하여 환경 세부 사항을 정의합니다.
  4. 유형 에서 스파크를 클릭합니다.
  5. 하드웨어 구성 에서 마스킹 플로우 작업의 테이블 크기에 따라 드라이버와 실행기 구성을 지정합니다.
  6. 실행자 수 아래에서 실행자 수를 늘리면 작업이 파티션으로 실행되도록 구성되었을 때 마스킹 흐름의 성능이 향상됩니다. 더 자세한 정보는 업무 성과 관리 항목우수 사례 섹션을 참고하세요.
  7. 소프트웨어 버전 목록 에서 Masking Flow Spark를 선택합니다.
  8. 작성을 클릭하십시오.

작업 작업

작업을 구성하려면:

  1. 작업의 이름을 입력하고 작업의 선택적 설명을 추가하십시오.
  2. 마스크된 데이터 사본을 삽입할 대상 연결을 추가하십시오. 소스 연결은 데이터를 읽는 데 사용됩니다.
  3. 새 연결을 추가하려면 +를 클릭하십시오. 스키마는 소스 테이블을 대상 테이블에 맵핑합니다. 테이블 정의는 대상 스키마에 이미 구성되어 있어야 합니다.
팁: 소스 자산이 Apache Hive 경우 Apache HDFS 대상 연결로 사용합니다.
  1. (선택 사항) 파티션 페이지에서 선택 사항으로 자산의 파티션 세부 사항을 편집할 수 있습니다:
    • 샘플링 설정을 사용하여 마스킹 플로우를 생성하는 경우, 파티션 세부사항 편집을 끄기로 설정하여 파티션 페이지 편집을 무시해도 됩니다.
    • 데이터가 많은 테이블이 있는 경우, 열을 파티션 열로 지정하여 파티션 세부 사항을 편집하는 것을 고려해 보십시오. 작업 수행 능력을 향상시키기 위해 파티션의 수를 늘릴 수 있습니다. 더 자세한 정보를 원하시면, 업무 성과 관리 항목우수 사례 부분을 참고하시기 바랍니다.
  2. (선택사항) 작업을 스케줄하거나 반복 작업을 스케줄하십시오.
  3. 작업을 검토하고 실행합니다.

자세한 정보

상위 주제: 마스킹 흐름으로 데이터 마스킹