エンティティー・データ内の潜在的なレコードの一致を確認して評価します。 データ品質を向上させ、エンティティー・データの信頼性を高めるために、リンクまたはリンク解除の決定を行います。
IBM Cloud Pak for Data および IBM Match 360 サービスのデータ品質機能を使用して、エンティティ データ内のデータ品質の問題を特定、理解、エスカレーション、修正、および防止します。
このトピックでは、
始める前に
潜在的な一致タスクの生成と修復を開始するには、データ・エンジニア・ユーザーが以下のタスクを完了している必要があります。
- 事務レビュー範囲を有効にし、事務レビューとオートリンクのしきい値を構成します。 詳しくは、 マッチング・アルゴリズムのカスタマイズと強化を参照してください。
- このサービス・インスタンスの潜在的な一致のワークフローを構成してアクティブ化します。 詳しくは、 IBM Match 360 ワークフローの構成を参照してください。
資産データの品質とエンティティーの信頼性の表示
プロジェクト所有者およびコラボレーターは、データ資産のデータ品質情報を表示できます。 データ品質情報は、プロジェクトの「資産データ品質」タブからアクセスできる一連のディメンション・スコアに要約されます。
データ品質評価に寄与するディメンションの 1 つに、エンティティーの信頼性があります。 エンティティー信頼性ディメンションは、接続されている IBM Match 360 エンティティー・データ資産についてのみ報告されます。 エンティティー信頼性スコアは、 IBM Match 360 が正確かつ完全であると確信している、システム内のマスター・データ・エンティティーのパーセンテージを表します。
マッチング・アルゴリズムを調整したり、潜在的な一致の問題を修復したりすることで、資産のエンティティー信頼性スコアを向上させることができます。
データ品質について詳しくは、 データ資産のデータ品質情報を参照してください。
資産のエンティティー信頼性スコアが低い場合は、一部の潜在的な一致タスクを生成して修復することでデータが改善される可能性があります。
データ品質情報とエンティティー信頼性スコアを表示するには、以下のようにします。
- Cloud Pak for Data ナビゲーション・メニューから、 「プロジェクト」 > 「すべてのプロジェクト」を選択します。 「プロジェクト」ページから、 IBM Match 360 プロジェクトを選択します。
- プロジェクトの 「資産」 タブをクリックし、データ品質分析を表示する接続済みマスター・データ資産を選択します。
- 「データ品質」 タブを選択します。 データ品質レポートを生成して表示するには、しばらく時間がかかる場合があります。
- データ品質レポートが使用可能な場合は、エンティティー信頼性スコアを確認します。
潜在的な一致の問題に対するタスクの生成
データ内の一致したエンティティー内の潜在的な問題を確認して修復するには、その前にいくつかの潜在的な一致タスクを生成する必要があります。 フル・データ・セットまたは一連の検索結果からタスクを生成して、タスクの有効範囲を絞り込むことができます。 例えば、データ・スチュワードのタスク受信トレイを圧倒することを避けるために、修復タスクを特定の地理的領域に集中させることができます。
- 必要な権限
- 潜在的な一致タスクを作成して修復するには、 IBM Match 360 サービスのデータ・エンジニアまたはデータ・スチュワード・ユーザー・グループのメンバーである必要があります。
潜在的な一致修復タスクを生成するには、以下のようにします。
マスターデータのナビゲーションメニューから、「Search'クリックし、マスターデータの検索ページを開きます。
オプションで、検索を実行してデータの範囲を絞り込みます。 検索について詳しくは、 Exploring master data entities and records in IBM Match 360を参照してください。
「タスクの作成」をクリックします。
修復タスク作成のパラメーターを定義します。
- すべてのデータに対してタスクを作成するか、現在の検索の結果 (該当する場合) に対してタスクを作成するかを定義します。
- これらのタスクに含めるエンティティーのタイプを選択します。
- このアクション中に作成するタスクの数を定義します。
「タスクの作成」 をクリックして、修復タスクの生成を開始します。
タスクの準備が完了すると、割り当てられたユーザーのタスク受信トレイに 「潜在的な一致の修復 (Remediate potential matches)」 タスクとして表示されます。 ユーザー割り当ては、ワークフロー構成で定義されます。
生成された 「潜在的な一致の修復 (Remediate potential matches)」 タスクに含まれていたエンティティーが、手動で、またはマッチング・プロセスによって更新された場合、 Cloud Pak for Data は、対応するタスクを自動的に無効化および削除します。 一致する更新の後にまだ一致する可能性のある問題がある場合は、タスク生成手順を繰り返すことによってタスクを再作成できます。
潜在的な一致を修復するためのタスクの完了
データ・スチュワード・ユーザーは、タスクの受信箱に潜在的な一致の問題がある場合、それらの問題を要求して、特定されたデータ品質の問題を修復することができます。
潜在的な一致の問題を修復するには、以下のようにします。
Cloud Pak for Data ナビゲーション・メニューから、 「ガバナンス」 > 「タスク受信トレイ」を選択します。 タスクの受信トレイが開き、割り当てられたタスクまたは完了したタスクが表示されます。
受信トレイに 「潜在的な一致の修復 (Remediate potential matches)」 タスクがあるかどうかを確認します。
フィルターアイコン「クリックすると、受信トレイの範囲を絞り込むためのフィルターオプションにアクセスできます。 例えば、修復タスクのみを表示するには、 「タスク・タイプ」で 「修復」を選択し、 「適用」をクリックします。 タスクの受信ボックスは、期限または割り当てられた日付でソートすることもできます。
タスクの作業を開始するには、タスクを開き、 「タスクの要求」をクリックします。 タスクを要求すると、システムはそのタスクが他のユーザーによって処理されないようにします。
タスクの要約の詳細を確認します。
「問題の修復」 をクリックして、タスクによって識別されたレコードの比較を開始します。 グラフィカル・ビューが開き、この潜在的な一致タスクに関連するすべてのレコードおよびエンティティーのビジュアル表示が表示されます。 レコード間の潜在的な一致は、点線で表されます。
オプションで、各レコードをクリックしてその詳細を表示します。
「潜在的な一致 (potential matches)」パネルに、このタスクに含まれている潜在的な一致決定ごとに 1 つの項目が表示されます。 各項目をクリックして詳細を確認します。 意思決定に役立つように、関連するレコードの横並びの比較が表示されます。
「一括アクションが使用可能 (Bulk action available)」というメッセージが表示された場合、システムは、このタスクのすべての問題に適用される一括決定 ( 「リンク」 または 「リンク解除」のいずれか) が可能である可能性があると判断しました。 「プレビュー」 をクリックして、決定を行う前の変更内容の視覚化を確認します。
「エンティティーの表示」 をクリックして、比較パネルを展開します。
タスクの決定ごとに、実行するアクション (手動リンク (リンク)、手動リンク解除 (リンク解除)、または問題のスキップ (スキップ)) を選択できます。 可能な場合、システムはインテリジェントな推奨を提供し、各推奨の信頼性スコアを提供します。
最終決定を行う前に、 「プレビュー」 をクリックして、エンティティーとレコード構造の外観の視覚化を確認することもできます。
決定を行い、 「リンク」、 「リンク解除」、または 「スキップ」をクリックして、モーダルで確認します。
ヒント: 変更はまだシステム内のデータに適用されていません。 「実行依頼」 をクリックして変更を適用します。「実行依頼」 をクリックして変更を適用し、このタスクを完了します。 「拒否」をクリックすると、変更は行われません。
タスクの受信トレイで 「完了」 をクリックすると、タスクの一部として完了した各アクティビティーの詳細を含む、完了したすべてのタスクのリストが表示されます。
もっと見る
- ワークフロー・タスクのモニター
- IBM Match 360 でのマスター・データ・エンティティーおよびレコードの探索
- レコードとエンティティのリンクを維持する
- マスター・データ・ワークフローの構成
- マッチング・アルゴリズムのカスタマイズと強化
親トピック: マスター・データの探索