プロジェクト内のデータの品質を評価するためのデータ品質ルールを作成および管理できます。
必要なアクセス権を持っている場合は、以下の方法でデータ品質ルールを管理できます。
これらのタスクは、ユーザー・インターフェースではなく API を使用して実行することもできます。 これらの API へのリンクは、 詳細情報 セクションにリストされています。
- 必須のサービス
- IBM Knowledge Catalog
- DataStageまたはDataStage as a Service Anywhere'
DataStage,を使用すると、サポートされている地域でデータ品質ルールを実行できます。 DataStage as a Service Anywhereを使用すると、リモート・エンジンを使用してIBM Cloudの外部でデータ品質ルールを実行できます。 リモートエンジンの設定については、DataStage as a Service Anywhereのドキュメントを参照してください。
必要な権限
データ品質ルールを表示するには、プロジェクトで少なくとも ビューアー 以上の役割を持っている必要があります。
データ品質ルールを作成、編集、または削除するには、 「データ品質資産の管理」 ユーザー権限 と、プロジェクト内の 「管理」 または 「エディター」 役割が必要です。
ルール実行のプロジェクト設定
プロジェクト・レベルの設定は、データ品質ルール実行の特定の側面を決定します。例えば、等価検査でストリング値の末尾スペースが無視されるかどうかなどです。 これらの設定は、特定のプロジェクトのすべてのデータ品質ルールに適用されます。 IBM Knowledge Catalog API Get project settings for data quality rules および Replace project settings for data quality rules を使用すると、プロジェクトごとにこれらの設定を確認または更新できます。
データ品質ルールの作成
さまざまなタイプのデータ品質ルールを作成できます。
データ品質ルールの編集
データ品質ルールを編集して、その説明、選択したデータ品質ディメンション、任意のビジネス用語割り当て、またはルール構成を更新できます。 関連項目のリストを管理することもできます。
データ品質ルールを編集するには、資産を開き、以下の適切なアクションを実行します。
説明やデータ品質寸法を更新するには、プロパティの横にある編集アイコン「」をクリックする。
ビジネス用語を管理するには、資産の 「ガバナンス成果物」 セクションに移動し、必要に応じて用語を追加または削除します。
ガバナンス・ルールを割り当てるか削除するには、アセットの 「ガバナンス成果物」 セクションに移動し、必要に応じてガバナンス・ルールを追加または削除します。
ルール構成を更新するには、 「ルールの編集」をクリックします。 ルール構成を編集するときに、ルールの作成方法を変更することもできます。つまり、データ品質定義の使用から SQL ステートメントの使用に、またはその逆に変更することができます。 ただし、これを行うと、既存のすべてのルール構成が破棄され、基本的に最初から開始する必要があります。
出力タイプを変更することもできます。 新しい選択に応じて、構成された出力設定はリセットまたは上書きされます。 変更前に書き込まれたルール出力は変更されません。
データを直接バインドするデータ品質ルールの場合、バインドされた各列と、その列を含む資産との 「データ品質の検証」 関係が 「関連項目」 セクションに追加されます。 このタイプの関係を持つ資産および列を、すべてのタイプのデータ品質ルールに手動で追加できます。 この関係を持つ外部管理バインディングまたは SQL ベースのデータ品質ルールを使用してデータ品質ルールに資産および列を追加すると、これらのタイプのルールが、対応する資産または列のデータ品質スコアに寄与します。 ルールによって生成されるスコアと問題は、 「検証対象のデータ品質」 関係タイプにリンクされているすべての資産と列について報告されます。
データ品質ルールを表示する際、情報アイコン「」をクリックすると、出力設定や関連アセットなどの詳細を表示することができます。
データ品質ルールの削除
データ品質ルールは、以下のいずれかの方法で削除できます。
- プロジェクトで、データ品質ルールを選択し、 「削除」をクリックします。
- データ品質ルールを開き、データ品質ルールの名前の横にあるオーバーフロー・メニューから 「削除」 を選択します。
データ品質ルールを削除すると、その実行履歴、関連付けられている DataStage フローおよびジョブもプロジェクトから削除されます。 プロジェクト内およびデータベース内の出力表は保持されます。 このデータ品質規則によって返された問題は削除され、データ品質とディメンション・スコアが再計算されます。
もっと見る
次のステップ
親トピック: データ品質の管理