0 / 0
資料の 英語版 に戻る
マスキング・フロー・ジョブの実行
最終更新: 2025年1月28日
マスキング・フロー・ジョブの実行

マスキング・フロー・ジョブでは、データ・ユーザーがマスクされたデータ・コピーのターゲット宛先を定義します。 ジョブをスケジュールすることができ、ジョブが正常に完了すると、ジョブ・レポートの要約を閲覧できます。

マスキング・フロー・ジョブを作成するには、以下の 2 つの方法があります:

  • マスキング・フローを作成した後、 ジョブの構成をクリックしてください。
  • 個々のデータ資産の オプション メニューをクリックして、マスキング・フローの作成をスキップし、そのデータ資産に対して直接マスキング・ジョブを構成します。
注: マスキング・フロー・ジョブの実行中に、ジョブをサポートする十分なメモリーがないとエラーが発生することがあります。 エラーを回避するために、データの最大サイズを 12GBsより大きくすることはできません。

マスキングフロー環境の構築

必要な権限

環境テンプレートを作成するには、次の2つの条件が両方とも満たされている必要があります

  • プロジェクトで管理者または編集者の役割を持っている必要があります。
  • プロジェクト作成者の IBM Cloud アカウントに所属している必要があります。

プロジェクトに環境テンプレートを作成するには:

  1. プロジェクトから [管理] タブをクリックし 、[環境] ページをクリックします。
  2. 「環境設定」ページで 「テンプレート」タブをクリックし 、「新しいテンプレート」 をクリックします。
  3. 名前と説明(オプション)を入力して、環境の詳細を定義します。
  4. タイプSpark をクリックします。
  5. ハードウェア構成では、マスキングフロージョブのテーブルのサイズに基づいて、ドライバと実行構成を指定します。
  6. [エグゼキューターの数] で、ジョブがパーティションで実行されるように構成されている場合にエグゼキューターの数を増やして、マスキング フローのパフォーマンスを向上させます。 詳細については 、「仕事のパフォーマンス管理」トピックベストプラクティスセクションを参照してください。
  7. ソフトウェアバージョン一覧から、 マスキングフローSpark を選択します。
  8. 「作成」 をクリックします。

ジョブの処理

ジョブを構成するには:

  1. ジョブの名前を入力し、オプションでジョブの説明を追加してください。
  2. マスクされたデータ・コピーを挿入するターゲット接続を追加してください。 ソース接続はデータの読み取りに使用されます。
  3. 新規接続を追加するには、「+」をクリックしてください。 スキーマは、ソース表をターゲット表にマップします。 表定義は、ターゲット・スキーマで既に構成されている必要があります。
ヒント: ソース資産が Apache Hiveの場合は、ターゲット接続として Apache HDFS を使用します。
  1. (オプション)パーティションページから、オプションとして、アセットのパーティションの詳細を編集することができます
    • セットサンプリングマスキングフローを作成する場合、[パーティションの詳細の編集] を [オフ] に設定することで、[パーティション] ページの編集を無視しても安全です。
    • 大量のデータを持つテーブルがある場合は、列をパーティション列として指定してパーティションの詳細を編集することを検討してください。 作業効率を向上させるには、パーティションの数を増やすことができます。 詳細については 、「仕事のパフォーマンス管理」トピックベストプラクティスセクションを参照してください。
  2. (オプション) ジョブをスケジュールするか、定期ジョブをスケジュールします。
  3. ジョブを確認して実行します。

もっと見る

親トピック: マスキング・フローによるデータのマスキング