0 / 0
資料の 英語版 に戻る
データ品質ディメンション
最終更新: 2024年12月13日
データ品質ディメンション

データ品質ディメンションは、データの測定可能な特性を記述し、データ品質要件の定義に役立ちます。 データ品質ディメンションを使用して、初期評価または継続的なモニタリングに関係なく、データ品質評価の予期される結果を判別します。

通常、データの状態は、 使用に適合障害フリー対応する仕様、または 期待と要件を満たすものとして定義できます。 データ品質を測定するときに、データの実際の状態をこの目的の状態と比較します。 ビジネス・プロセスにとって重要な標準、期待、および要件は、データの特性またはディメンションとして表されます。

Data Management Association (DAMA) International は、データ品質の 6 つのコア・ディメンションについて説明した資料を公開しました。

コア・データ品質ディメンション
ディメンション 説明 このディメンションに関連する問題を識別する事前定義のデータ品質検査
正解性 データ値は、実際の値に可能な限り近くなります。 ありません。
完全性 必要なすべてのデータ値が存在します。 予期しない欠落値
整合性 列内のデータ値はルールに従います。 大/小文字の不整合
欠損値の表現の不整合
「疑わしい値」
適時性 データは、必要な時点からの現実を表します。 ありません。
固有性 個別の値は 1 回だけ表示されます。 予期しない重複値
妥当性 データは、その定義の形式、タイプ、または範囲に準拠しています。 データ・クラス違反
データ・タイプ違反
形式違反
範囲外の値

IBM Knowledge Catalog API を使用して、独自のデータ品質ディメンジョンを作成できます

もっと見る

親トピック: データ品質の管理

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細