拡張マスキング・オプション

最終更新: 2025年3月27日
拡張マスキング・オプション

高度なマスキングオプションは、高度な非識別化技術でデータを保護することにより、データ保護ルールの機能を拡張します。 この技法は、データのフォーマットと保全性を維持します。 高データ・ユーティリティーにより、データ・サイエンティスト、ビジネス・アナリスト、アプリケーション開発者などのデータ・ユーザーは、保護されたデータから高品質の洞察を得ることができます。

拡張マスキング・オプションには、以下の機能が含まれます。

  • AI プロジェクト用のユーティリティーを保守するための、165 個の事前定義データ・クラスのフォーマットを維持したまま識別を解除します。
ヒント:

高度なマスキング・オプションで定義されたデータ保護ルールは、IBM Data Virtualizationに適用されます。 ルールは、 IBAN および URLを除くすべての事前定義データ・クラスに対して、フォーマット保持の難読化を実装できます。

  • 関連するデータ・ソース全体で一貫してデータを保護するための関係の整合性です。

以下のシナリオでは、拡張マスキング・オプションがデータ保護ルールの機能を拡張する方法について説明します。

データ・サイエンティストは、クレジット・カード番号や銀行口座番号などの金融データを機械学習モデルで使用して、不正取引を予測したいと考えています。 クレジット・カード番号を XXXXXXXXX にすると、求めている結果を生成することはできません。 代わりに、実際のクレジット・カード番号が必要です。 拡張マスキング・オプションのフォーマット保存方式では、フォーマット要件を満たすクレジット・カード番号が生成されます。 フォーマット要件には、問題 ID 情報 (どのクレジット・カード会社 (Visa、Mastercard など) がカードを発行したかを指定する)、luhn チェックサム・アルゴリズムなどの保守が含まれます。 現実的なマスキングにより、データ・ユーザーが正確な結果を生成できるようになります。

医療データ・ユーザーは、患者の名前と住所情報を含む患者データを使用して、末期疾患の臨床研究の結果を分析したいと考えています。 患者の名前を「XXXX」でマスクして、探している結果を生成することはできません。 その代わり、現実的な名前と現実的な通りの名前、都市、国が必要だ。 その結果、データ利用者が分析を行う際には、「123 Maple Lane」に住む「Jane Doe」が乳がんの研究参加者であるという、より広範なコンテキストを持つことになります。

重要:

拡張マスキング・オプションの特異性のため、これらのオプションは一度に 1 つのデータ・クラスにのみ適用できます。 これらのオプションは、事前定義されたすべての 165 個の IBM Knowledge Catalog データ・クラス用に最適化されており、各データ・クラスの最適なフォーマット保持オプションとして推奨されています。 ただし、カスタム定義の IBM Knowledge Catalog データ・クラスには適用できません。

拡張マスキング・オプションは、編集および難読化のマスキング方式に対してのみ有効にすることができます。 拡張マスキング・オプションは、 mask data in columns containing data classを使用してルールに適用されます。 ビジネス用語、列名、およびタグはまだサポートされていません。

注: 表を作成する場合は、 Hiveでソース表とターゲット表の列名に特殊文字を使用しないでください。 列名で使用される特殊文字は、内部結合ではサポートされません。

拡張マスキング・オプションを使用したデータ保護ルールの作成

拡張マスキング・オプションは、データ・クラスに対してのみ使用可能です。

  1. 条件を入力し、処理対象の属性を選択します。 推奨される方法は、以下のいずれかの方法でルールを作成することです:

    • データ・クラスに __insert data class__が含まれている場合は、データ・クラス __insert data class__が含まれている列のデータをマスクします。

    • オプションで、資産所有者、ビジネス用語、タグなどの条件を追加できますが、これらのガバナンス成果物がどのように機能するかを理解するために注意してください。 意図せずにマスクされていないデータが漏えいする可能性があります。 データ保護ルールの管理を参照してください。

    • 小さい入力データ (ブール値や 1 桁の数値など) をマスキングすると、マスキング・フロー・ジョブの実行時、データのプレビューまたはダウンロード時にデータがマスクされなかったように見えることがあります。 ただし、データはマスクされ、マスクされた値はマスクされていない値と同じです。

  2. データをマスクするには、以下の方法を選択します:

    • 列の編集
    • 列の難読化

    拡張マスキングでは置換はサポートされていません。

  3. 「拡張マスキング・オプション」セクションでマスキング・オプションを選択します。 一部のオプションはデフォルトで選択されています。 詳しくは、 データ・メソッドのリダクション および データ・メソッドの難読化 を参照してください。

  4. ルールを作成します。 資産内のデータをマスクする方法について詳しくは、 データのマスク を参照してください。

マスキング・プレビューの使用

「サンプル・データ」セクションの「プレビュー前」には、マスキング・フロー・ジョブを実行する前にカタログ、プロジェクト、および動的でデータ資産を表示しているときに、データがどのようにマスクされるかが表示されます。 「サンプル・データ」セクションの「プレビュー後」には、マスキング・フロー・ジョブの実行によって生成されるマスク・コピーでデータがどのようにマスクされるかが表示されます。

Alt text

ビデオ・アイコンを見る このビデオを見て、プロジェクトで拡張マスキング・オプションを設定し、マスキング・フロー資産を作成する方法を確認してください。

このビデオは、この資料の概念とタスクを学習するための視覚的な方法を提供します。

次のステップ

もっと見る

親トピック: データ保護ルール