データ品質ルールの管理
プロジェクト内のデータの品質を評価するためのデータ品質ルールを作成および管理できます。
必要なアクセス権を持っている場合は、以下の方法でデータ品質ルールを管理できます。
これらのタスクは、ユーザー・インターフェースではなく API を使用して実行することもできます。 これらの API へのリンクは、 詳細情報 セクションにリストされています。
- 必須のサービス
- IBM Knowledge Catalog
- DataStageまたはDataStage as a Service Anywhere'
DataStage,を使用すると、サポートされている地域でデータ品質ルールを実行できます。 DataStage as a Service Anywhereを使用すると、リモート・エンジンを使用してIBM Cloudの外部でデータ品質ルールを実行できます。 リモートエンジンの設定については、DataStage as a Service Anywhereのドキュメントを参照してください。
必要な権限
データ品質ルールを表示するには、プロジェクトで少なくとも ビューアー 以上の役割を持っている必要があります。
データ品質ルールを作成、編集、または削除するには、 「データ品質資産の管理」 ユーザー権限 と、プロジェクト内の 「管理」 または 「エディター」 役割が必要です。
ルール実行のプロジェクト設定
プロジェクト・レベルの設定は、データ品質ルール実行の特定の側面を決定します。例えば、等価検査でストリング値の末尾スペースが無視されるかどうかなどです。 これらの設定は、特定のプロジェクトのすべてのデータ品質ルールに適用されます。 IBM Knowledge Catalog API Get project settings for data quality rules および Replace project settings for data quality rules を使用すると、プロジェクトごとにこれらの設定を確認または更新できます。
データ品質ルールの作成
さまざまなタイプのデータ品質ルールを作成できます。
データ品質ルールの編集
データ品質ルールを編集して、その説明、選択したデータ品質ディメンション、任意のビジネス用語割り当て、またはルール構成を更新できます。 関連項目のリストを管理することもできます。
データ品質ルールを編集するには、資産を開き、以下の適切なアクションを実行します。
- 説明またはデータ品質のディメンションを更新するには、プロパティの横にある編集アイコン
をクリックします。
- ビジネス用語を管理するには、資産の 「ガバナンス成果物」 セクションに移動し、必要に応じて用語を追加または削除します。
- ガバナンス・ルールを割り当てるか削除するには、アセットの 「ガバナンス成果物」 セクションに移動し、必要に応じてガバナンス・ルールを追加または削除します。
- To add or remove related artifacts, assets, or columns, go to the 関連アイテム section of the asset, and add or remove items as needed.
- ルール構成を更新するには、 「ルールの編集」をクリックします。 あらゆる種類のルールについて、出力タイプを変更することができます。 新しい選択に応じて、構成された出力設定はリセットまたは上書きされます。 変更前に書き込まれたルール出力は変更されません。 SQLベースのルールについては、SQLステートメントを変更することができます。 定義に基づくルールについては、使用するデータ品質定義とサンプリング設定を変更することができます。 バインディングマネージド変更することはできません。
データを直接バインドするデータ品質ルールについては、バインドされた各カラムとの関係のデータ品質を検証する項目が、 関連項目セクションに追加されます。 このタイプの関係を持つ列は、 マネージドまたはSQLベースのデータ品質ルールを使用して、データ品質ルールに手動で追加することができます。 次に、これらの種類のルールは、対応するカラムのデータ品質スコアに貢献します。
When you view a data quality rule, you can click the 情報 icon to view more details such as output settings or related assets.
データ品質ルールの削除
データ品質ルールは、以下のいずれかの方法で削除できます。
- プロジェクトで、データ品質ルールを選択し、 「削除」をクリックします。
- データ品質ルールを開き、データ品質ルールの名前の横にあるオーバーフロー・メニューから 「削除」 を選択します。
データ品質ルールを削除すると、その実行履歴、関連付けられている DataStage フローおよびジョブもプロジェクトから削除されます。 プロジェクト内およびデータベース内の出力表は保持されます。 このデータ品質規則によって返された問題は削除され、データ品質とディメンション・スコアが再計算されます。
もっと見る
次のステップ
親トピック: データ品質の管理