データ品質に関するプロジェクト設定
データ品質ルールを一貫して設定するために、プロジェクト内のどのデータ品質ルールにも適用できるデフォルト設定を構成することができます。
- 必要な権限
- データ品質のデフォルト設定を構成するには、プロジェクトの Admin ロールが必要です。 すべてのプロジェクト・コラボレーターが設定を閲覧できます。
デフォルト設定にアクセスするには、プロジェクトの「 管理」 ページで 「ツール」>「データ品質 」を選択します。
出力テーブル
データ品質ルールの出力テーブルを一貫して設定するために、デフォルト設定を定義することができます。
出力のタイプおよび場所
新しい出力テーブルを定義するか、ルール出力を書き込む既存のテーブルを選択する。 サポートされているデータベースの種類については、 キュレーションとデータ品質のためにサポートされているデータソースを参照してください。
新しいテーブルを定義する場合、テーブル名にはユーザー定義名、名前を動的に作成するためのパラメータ、ユーザー定義名とパラメータの組み合わせ、またはパラメータの組み合わせを使用できます。
ユーザー定義のテーブル名はこの規約に従わなければならない:
- 名前の最初の文字はアルファベットでなければならない。
- 名前の残りの部分は、アルファベット、数字、アンダースコアで構成することができる。
- 名前にスペースを含んではならない。
動的な名前の作成には、これらのパラメータを使用できます:
#execution_id#
#rule_id#
#rule_id#
#rule_name#
#project_id#
#job_id#
#job_run_id#
#rule_id#
値が変化するパラメータについては、新しいテーブルが作成されるかもしれない:
- 各ルールの
#job_run_id#
- ルールがデータ品質ルールUIまたはAPIコールから実行される場合、
#execution_id#
さらに、以下のオプションも選択できる:
問題が見つかった場合のみテーブルを作成する
このオプションは、ルールが出力レコードを生成しない場合に、空のテーブルが作成されるのを回避する。 ただし、その名前のテーブルが以前のルール実行時に生成されたためにすでに存在している場合、そのテーブルは変更されないままである。
生成された出力テーブルをプロジェクト資産としてインポートする
ルール出力に簡単にアクセスできるようにするには、新しいルール出力テーブルをデータ資産プロジェクトに追加する。 データベースクエリを実行する代わりに、プロジェクトの 資産 ページまたはルールの 走行履歴 からデータ資産データを表示できます。
デフォルトではこのオプションは有効になっています。
この設定をデータ品質ルールで使用できるようにするには、その設定を保存します。 設定されたテーブルが「 Current 」と表示される。
この設定はいつでも更新できる。 これらの更新は、新しいルールや、プロジェクトの設定を継承するように構成された既存のルールの新しい実行に適用される。
もっと見る
親トピック データ品質の管理