데이터 품질 차원은 데이터의 측정 가능한 특성을 설명하고 데이터 품질 요구사항을 정의하는 데 도움을 줍니다. 데이터 품질 차원을 사용하여 데이터 품질 평가의 예상 결과 (초기 평가 또는 진행 중인 모니터링) 를 판별하십시오.
데이터의 상태는 일반적으로 사용에 적합, 결함 없음, 스펙에 해당또는 예상 및 요구사항 충족으로 정의할 수 있습니다. 데이터 품질을 측정할 때 데이터의 실제 상태를 이 원하는 상태와 비교합니다. 비즈니스 프로세스에 중요한 표준, 예상 및 요구사항은 데이터의 특성 또는 차원으로 표현됩니다.
Data Management Association (DAMA) International은 데이터 품질의 6가지핵심 차원을 설명하는 논문을 발표했습니다.
차원 | 설명 | 이 차원과 연관된 문제를 식별하는 사전 정의된 데이터 품질 검사 |
---|---|---|
정확도 | 데이터 값은 가능한 실제 값에 가깝습니다. | 없음. |
완전성 | 모든 필수 데이터 값이 있습니다. | 예기치 않은 결측값 |
일관성 | 열 내의 데이터 값은 규칙을 준수합니다. | 일치하지 않는 대문자화 누락된 값의 일치하지 않는 표시 의심스러운 값 |
시기적절성 | 데이터는 필수 시점의 현실을 나타냅니다. | 없음. |
고유성 | 구별 값은 한 번만 표시됩니다. | 예기치 않은 중복 값 |
유효성 | 데이터는 해당 정의의 형식, 유형 또는 범위를 준수합니다. | 데이터 클래스 위반 데이터 유형 위반 형식 위반 범위를 벗어난 값 |
IBM Knowledge Catalog API 데이터 품질 차원 만들기 를 사용하여 자신만의 데이터 품질 차원을 만들 수 있습니다.
데이터의 상태는 일반적으로 사용에 적합, 결함 없음, 스펙에 해당또는 예상 및 요구사항 충족으로 정의할 수 있습니다. 데이터 품질을 측정할 때 데이터의 실제 상태를 이 원하는 상태와 비교합니다. 비즈니스 프로세스에 중요한 표준, 예상 및 요구사항은 데이터의 특성 또는 차원으로 표현됩니다.
Data Management (DAMA) International은 데이터 품질의 6가지 핵심 차원, 즉 정확성, 완전성, 일관성, 적시성, 고유성, 타당성을 설명하는 논문을 발표했습니다
또한, IBM Knowledge Catalog 는 동질성이라는 차원을 제공합니다.
이러한 모든 차원은 메타데이터 강화의 일환으로 데이터 품질 검사를 실행하거나 개별 데이터 품질 규칙을 실행하여 평가할 수 있습니다.
다음 표는 데이터 품질 차원을 설명하고 특정 차원과 관련된 문제를 식별할 수 있는 메타데이터 강화의 데이터 품질 검사를 나열합니다
| 차원 | 설명 | 사전 정의된 데이터 품질 검사
| 데이터 품질 검사 유형
| | ----- | ----- | ----- | | 정확도 | 데이터 값은 실제 값에 최대한 가깝습니다. | 없음. | 없음. | | 완전성 | 필요한 모든 데이터 값이 있습니다. | 예상치 못한 누락 값 | 완전성 검사 | | 일관성 | 열 내의 데이터 값이 규칙을 따릅니다. | 일관되지 않은 대문자 사용
누락된 값의 일관되지 않은 표현
의심되는 값 | 대문자 스타일 확인
누락된 값 표현 확인
참조 무결성 검사 ( IBM Knowledge Catalog Premium )
의심값 확인 | | 동질성
IBM Knowledge Catalog Premium | 데이터는 시간이 지남에 따라 유사하고 일관됨. | 없음. | 역사적 안정성 | | 적시성 | 데이터는 필요한 시점의 현실을 나타냄. | 없음. | 없음. | | 고유성 | 고유한 값이 한 번만 나타남. | 예상치 못한 중복 값 | 고유성 검사 | | 유효성 | 데이터는 정의의 형식, 유형 또는 범위를 준수함. | 데이터 클래스 위반
데이터 유형 위반
형식 위반
범위를 벗어난 값 | 데이터 클래스 확인
데이터 유형 검사
형식 확인
길이 확인
가능한 값 확인
범위 확인
정규식 검사 |
자세한 정보
- 데이터 품질 분석 결과
- 사전 정의된 데이터 품질 검사
- 마스터 데이터 워크플로우 구성
- IBM Knowledge Catalog API: 모든 데이터 품질 차원 나열
- IBM Knowledge Catalog API: 데이터 품질 차원 만들기
상위 주제: 데이터 품질 관리