チュートリアル: データの保護

このチュートリアルでは、データー・ファブリック試用版の Data Governance と Privacy ユース・ケースを使用してデータを保護します。 目標は、データ・ファブリック内のサービス全体でデータへのアクセスを制御することです。

このチュートリアルのストーリーは、ゴールデン・バンクには、高品質の顧客住宅ローン・データにアクセスする必要があるいくつかの部門があるということです。 ガバナンス・チームのデータ・スチュワードは、機密性の高い住宅ローン・データを保護するために、データ保護ルールを作成し、マスキング・フローを作成します。

このチュートリアルでは、以下のタスクを実行します:

  1. アクセスを拒否するデータ保護ルールを作成します。
  2. データをマスクするデータ保護ルールを作成します。
  3. データをプロジェクトにインポートします。
  4. データを強化します。
  5. メタデータ・エンリッチメントの結果を表示します。
  6. カタログを作成します。
  7. カタログに資産を公開します。

このチュートリアルでヘルプが必要な場合は、 Cloud Pak for Data コミュニティー・ディスカッション・フォーラム {: new_window}で質問するか、回答を見つけます。

ヒント: このチュートリアルを完了するのに最適な方法として、1 つのブラウザー・タブで Cloud Pak for Data as a Service を開き、このチュートリアル・ページを別のブラウザー・タブで開いたままにして、2 つのアプリケーションを簡単に切り替えることができます。

前提条件

Cloud Pak for Data as a Service に登録し、Data Governance and Privacy ユース・ケースに必要なサービスをプロビジョンする必要があります。

Cloud Pak for Data as a Service には、以下のいずれかの方法で登録できます:

必要なサービスをプロビジョンする

以下のステップに従って、必要なサービスを検証またはプロビジョンします。

  1. Cloud Pak for Data ナビゲーション・メニューから、 Services > Service instancesを選択します。
  2. Product ドロップダウン・ボックスを使用して、既存の Watson Knowledge Catalog サービス・インスタンスがあるかどうかを判別します。
  3. Watson Knowledge Catalog サービス・インスタンスを作成する必要がある場合は、 Add serviceをクリックします。
  4. Watson Knowledge Catalogを選択します。
  5. 「ライト」プランを選択します。
  6. 「作成」をクリックします。

データの信頼性

ビデオを見る このタスクをプレビューするには、 00:47から始まるビデオをご覧ください。

データを信頼する チュートリアルを完成して、データ資産をインポートして強化し、カタログに公開します。

ステップ 1: アクセスを拒否するデータ保護ルールを作成する

ビデオを見る このタスクをプレビューするには、 02:23から始まるビデオをご覧ください。

データ保護ルールは、データ資産へのアクセスを制御します。 以下の手順でデータ保護ルールを作成して、一部の住宅ローン・データ資産の機密情報へのアクセスを拒否します。

  1. Cloud Pak for Data ナビゲーション・メニューから、 Catalogs > View all catalogsを選択します。
  2. Mortgage Approval Catalogを開きます。
  3. CREDIT_SCORE データ資産をクリックします。 機密 (confidential) タグが含まれていることに注意してください。 ルールを作成してこのデータ資産へのアクセスを拒否します。
  4. Cloud Pak for Data ナビゲーション・メニューから、 Governance > Rulesを選択します。
  5. Add rule > New rule をクリックします。
  6. データ保護ルールを選択します。
  7. 「次へ」をクリックする。
  8. ルール名には、 Confidential Informationと入力します。
  9. ビジネス定義の場合は、 Rule to prevent unauthorized users from accessing data assets that have been tagged as confidential. と入力します
  10. 条件 1の場合は、以下のオプションを選択します。
    • タグ
    • 次のいずれかを含む
    • 機密情報
  11. 処置 (Action)の場合は、 データへのアクセスの拒否を選択します。
  12. 「作成」をクリックします。 このルールは、「機密」とタグ付けされたデータ資産にアクセスしようとするすべてのユーザーに対して、データへのアクセスを拒否するようになりました。 このルールは、「 Catalog Preview」、「Catalog Download」、「Data Refinery」、および「Project Asset プレビュー」で適用されます。 ルールは、ルールを作成したユーザー、またはプロジェクトに資産を追加したユーザーには適用されないことに注意してください。 CREDIT_SCORE データ資産にアクセスしようとする他のユーザーが見ることを確認するには、XX:XX のビデオをご覧ください。

ステップ 2: データをマスクするためにデータ保護ルールを作成する

ビデオを見る このタスクをプレビューするには、 02:23から始まるビデオをご覧ください。

以下の手順を実行して米国社会保障番号の列を含むデータ資産をマスクするデータ保護ルールを作成します。

  1. 住宅ローン承認カタログで、 MORTGAGE_APPLICANTS データ資産をクリックします。
  2. 資産 (Asset) タブをクリックして、データをプレビューします。 列の 1 つに社会保障番号が含まれていることに注意してください。 この列をマスクするルールを作成します。
  3. Cloud Pak for Data ナビゲーション・メニューから、 Governance > Rulesを選択します。
  4. Add rule > New rule をクリックします。
  5. データ射影ルールを選択します。
  6. 「次へ」をクリックする。
  7. ルール名には、 Redact Social Security Numberと入力します。
  8. ビジネス定義の場合は、 Rule to redact Social Security Number. と入力します
  9. 条件 1の場合は、以下のオプションを選択します:
    • ビジネス用語
    • 次のいずれかを含む
    • 社会保険番号
  10. 処置 (Action)の場合は、 マスク・データを選択します。 ビジネス用語 および 社会保障番号 が記入されます。
  11. マスキング・オプションの場合は、 編集 (Redact)を選択します。 これにより、データが Xs に置き換えられます。 各マスキング・オプションの上にカーソルを移動すると、選択したオプションを使用してマスクされたサンプル・データを表示できます。
  12. 「作成」をクリックします。 このルールは、データ資産内の米国社会保障番号の列を編集します。 を視聴して、MORTGAGE_APPLICANTS データ資産にアクセスする他のユーザーが見ることについては XX:XX のビデオをご覧ください。

ステップ 3: 拡張マスキングを使用したデータ保護ルールを作成する

ビデオを見る このタスクをプレビューするには、 02:23から始まるビデオをご覧ください。

以下の手順を実行してメール・アドレスを持つ列を含むデータ資産をマスクするデータ保護ルールを作成します。

  1. Cloud Pak for Data ナビゲーション・メニューから、 Catalogs > View all catalogsを選択します。
  2. Mortgage Approval Catalogを開きます。
  3. MORTGAGE_APPLICANTS データ資産をクリックします。 いずれかの列にメール・アドレスが含まれていることに注意してください。 拡張マスキングを使用してこの列をマスクするルールを作成します。
  4. Cloud Pak for Data ナビゲーション・メニューから、 Governance > Rulesを選択します。
  5. Add rule > New rule をクリックします。
  6. データ射影ルールを選択します。
  7. 「次へ」をクリックする。
  8. ルール名には、 Obfuscate email addressと入力します。
  9. ビジネス定義の場合は、 Rule to obfuscate the email address using advanced masking options. と入力します
  10. 条件 1の場合は、以下のオプションを選択します:
    • データ・クラス
    • 次のいずれかを含む
    • メール・アドレス
  11. 処置 (Action)の場合は、 マスク・データを選択します。
  12. 含まれる列の (in columns containing) フィールドには、 データ・クラスを選択します。 メール・アドレス が入力されます。
  13. マスキング・オプションの場合は、 難読化 (Obfuscate)を選択します。
  14. 拡張マスキング・オプションを有効にするを選択します。
  15. オプションを変更するたびにプレビューを最新表示するには、 自動最新表示プレビュー を選択します。
  16. 難読化方式 (Obfuscate method)の場合は、 フォーマットの保持 (Preserve format)を選択します。 「保持フォーマット方式」では、ユーザー名を生成するか、またはユーザー名の接頭部と番号を提供することができます。
    1. 接頭部と数値 (Prefix plus number)を選択し、 mail と入力してプレビューを表示します。
    2. このシナリオでは、 ユーザー名の生成 (Generate user name)を選択することをお勧めします。
  17. ドメイン名 (Domain name) オプションには、以下の 3 つのオプションがあります:
    1. メール・アドレスの表示をプレビューするには、 共通メール・サービス (Common email services) を選択します。
    2. メール・アドレスの表示をプレビューするには、 カスタム (Custom) を選択します。
    3. このシナリオでは、 オリジナル (Original)を選択することをお勧めします。
  18. 取り消し可能 (Reversability)の場合、唯一のオプションは永続の 不可逆的なマスキング (Irreversible masking) です。 その他のデータ・タイプの場合は、 可逆マスキング (Reversible masking) を選択することができます。これにより、 暗号鍵を使用して元の値をリカバリーすることができます。
  19. 一貫性 (Consistency)の場合は、 反復可能 (Repeatable)を選択します。 反復可能オプションを使用すると、マスキングは参照整合性を使用して行われます。つまりメール・アドレスが smith.lee になるたびに、shoshana.vitrano に置き換えられます。
  20. 入力の検証の場合は、デフォルト値の 入力の検証を保持します。 入力検証オプションは、正しくない値があるかどうかを検査し、正しくフォーマットされていない値がある行を削除します。
  21. 「作成」をクリックします。 このルールがあると、カタログ内のデータを動的にプレビューするとき、またはマスキング・フローを介してデータ・コピーを静的に抽出するときに、データ・ユーザーに対してカタログ内のデータが保護されます。 を視聴して、MORTGAGE_APPLICANTS データ資産にアクセスする他のユーザーが見ることについては XX:XX のビデオをご覧ください。

ステップ 4: マスキング・フローの作成

ビデオを見る このタスクをプレビューするには、 02:23から始まるビデオをご覧ください。

マスキング・フローは、マスクされたデータのコピーまたはマスクされたデータのサブセットをカタログから別のターゲット・データベースにプロビジョンして送信します。 作成されたコピーは、管理者が以前にセットアップしたデータ保護ルールで拡張マスキング・オプションを使用して識別解除されます。 マスキング・フローを作成して実行するには、以下の手順を実行します。

  1. Cloud Pak for Data ナビゲーション・メニューから、 Catalogs > View all catalogsを選択します。
  2. 住宅ローン承認カタログ (Mortgage Approval Catalog)をクリックします。
  3. カタログ内の MORTGAGE_APPLICANTS データ資産を選択します。
  4. プロジェクトに追加 (Add to project)をクリックします。
    1. 対象 (Target)の場合は、Data Governance and Privacy プロジェクトを選択します。
    2. 「追加」をクリックします。
  5. Cloud Pak for Data ナビゲーション・メニューから、 Projects > View all projects を選択します。
  6. Data Governance and Privacy プロジェクトをクリックします。
  7. 「資産」タブをクリックします。
  8. 新規資産 (New Asset)をクリックします。
  9. データ・プライバシー (Data privacy)を選択します。
  10. 名前 (Name) の場合は、Applicants in California と入力します。
  11. 説明 (Description)の場合は、 Creates masked copy of applicants and related recrods for applicants in Californiaと入力します。
  12. 「次へ」をクリックする。
  13. 2 つのマスキング・タイプがあります。 1 つまたは複数の表をコピーする は、関係を検索せずに、表のマスクされた cop8ies を生成します。 ドライバー・テーブルと関連データのコピー すると、主キーと外部キーの関係を持ち、関連するサブセットを持つデータのサブセットを作成できます。 このシナリオでは、 1 つまたはそれ以上の表のコピー (Copy one or more tables) を選択します。
  14. プロジェクトからデータを追加 (Add data from project)をクリックします。
    1. Data Fabric 試用版- Db2 Warehouse 接続を選択します。
    2. AI_MORTGAGE スキーマを選択します。
    3. MORTGAGE_APPLICANTS テーブルを選択します。
    4. 「選択」をクリックします。 この資産にはマスクされた列が含まれていることが認識されていることに注意してください。
  15. 定義 (Define)をクリックします。
    1. 状態 (STATE) 列の横にある + (正符号) をクリックします。
    2. 値には、 Californiaと入力します。
    3. 保存 (Save) をクリックして、その値を保存します。
    4. 保存 (Save) を再度クリックして、 マスキング・フローの作成 ページに戻ります。
  16. 「ジョブの作成 (Create Job)」をクリックします。
    1. 名前 (Name) の場合は、Applicants in California と入力します。
    2. 「次へ」をクリックする。
    3. ターゲット接続の場合は、 Data Fabric 試用版- Db2 Warehouse 接続を選択します。
    4. ターゲット・スキーマの場合は、 銀行 (BANKING)を選択します。
    5. 次へ をクリックして、パーティションに進みます。
  17. 次へ をクリックして、スケジュールに進みます。
  18. 次へ をクリックして、レビューを続行します。
  19. ジョブの作成と実行をクリックします。
  20. ジョブ実行が完了したら、ターゲット・データベースにナビゲートして結果を確認できます。 XX:XX にあるビデオを視聴して、 Db2 Warehouse インスタンスで表がどのように表示されるかについては、 XX:XX のビデオをご覧ください。

次のステップ

これで、データ・ファブリック内のデータを評価、共有、シェーピング、および分析することで、データを認識する準備ができました。データの把握 チュートリアルを参照してください。

詳細情報

親トピック: データ・ファブリック・チュートリアル