데이터 자산이 성공적으로 분석되면 데이터 자산 레벨 및 열 레벨 모두에 결과가 표시됩니다. 분석 결과에는 데이터 자산의 컨텐츠 및 구조에 대한 정보와 데이터의 전체 품질에 대한 메트릭이 포함됩니다.
데이터 품질 분석 결과는 프로젝트 또는 카탈로그에 있는 자산의 데이터 품질 페이지에서 사용 가능합니다. 또한 자산 또는 열의 품질 점수를 클릭하여 메타데이터 인리치먼트 내에서 액세스할 수도 있습니다.
- 필요한 권한
- 분석 결과를 보려면 작업공간의 협업자여야 합니다.
점수를 계산하는 방법을 변경하려면 프로젝트에서 관리 또는 편집자 역할이 있어야 합니다.
새 데이터 품질 검사를 작성하려면 프로젝트에서 관리 또는 편집자 역할과 데이터 품질 자산 관리 권한이 있어야 합니다.
규칙 실행 기록 또는 데이터 품질 페이지에서 데이터 품질 문제를 일으킨 데이터(출력 테이블)를 보려면 드릴다운하여 세부 정보로 발행 권한이 있어야 합니다. 그러나 출력 테이블용으로 생성된 프로젝트의 데이터 자산은 연결에 액세스할 수 있는 모든 사람이 액세스할 수 있습니다. 이 데이터 자산에 대한 액세스를 제한하려면 출력 테이블이 저장된 데이터 소스에 대한 연결을 개인 자격 증명으로 설정해야 합니다.
데이터 품질 정보는 다음과 같이 프로젝트 또는 카탈로그에서 사용 가능하게 됩니다.
프로젝트에서 첫 번째 데이터 품질 검사가 다음 방법 중 하나로 데이터 자산에 대해 실행된 후 또는 연결된 IBM Match 360 엔티티 데이터 자산이 추가된 경우:
- 데이터 품질 분석은 메타데이터 강화의 일부로 자산에서 실행됩니다.
- 데이터 품질 규칙은 자산에서 실행됩니다.
카탈로그의 경우:
- 데이터 품질 정보가 있는 데이터 자산이 카탈로그에 공개됩니다.
품질 점수가 다시 계산되고 데이터가 다음과 같이 새로 고쳐집니다.
프로젝트에서 데이터 품질 검사가 자산에서 실행될 때마다 또는 IBM Match 360 엔티티 데이터 자산이 업데이트될 때마다:
- 데이터 품질 분석은 메타데이터 인리치먼트의 컨텍스트에서 실행됩니다.
- 데이터 품질 규칙이 자산에서 실행됩니다.
- IBM Match 360 일치 알고리즘이 변경되거나 잠재적 일치 문제가 수정됩니다.
카탈로그의 경우:
- 자산은 프로젝트에서 공개됩니다.
품질 점수가 마지막으로 업데이트된 시기를 즉시 확인할 수 있습니다.
자산에 대한 데이터 품질 정보
자산의 데이터 품질 정보에 액세스할 때 전체 데이터 품질 점수 및 자산에서 실행된 데이터 품질 검사의 결과가 표시됩니다. 또한 자산 열에 대한 분석 결과에 액세스할 수 있습니다.
메타데이터 강화의 일부로 데이터 품질 SLA 규칙이 평가되는 경우, 데이터 품질 SLA 규칙이 적용되는 자산에는 SLA 준수에 대한 정보도 포함됩니다.
자산 레벨의 전체 점수
품질 점수를 그래픽으로 표시하면 자산에 적용되는 차원과 관련하여 자산의 전체 품질 및 품질 레벨을 한 눈에 볼 수 있습니다. 이러한 점수의 경우 추세 정보는 시간 경과에 따라 차원의 전체 품질 또는 품질 점수가 변경되는 방식을 표시합니다. 추세가 30, 90또는 180일동안 표시되는지 여부를 선택할 수 있습니다. 이전에 이 차원에 기여한 검사가 없는 경우 차원은 추세 정보를 표시하지 않습니다.
전체 자산 점수는 자산 열에서 제공하는 점수의 가중 평균입니다. 각 차원 점수는 개별 검사에서 제공하는 해당 차원 점수의 가중 평균입니다.
전체 및 차원 점수와 추세 정보는 다음 변경사항에 대해 다시 계산됩니다.
- 자산에서 데이터 품질 검사가 실행됩니다.
- 검사 또는 열에 대한 전체 점수에 기여 설정이 변경됩니다.
- 자산에 적용된 데이터 품질 규칙이 삭제됩니다.
- 자산 프로파일이 자산의 프로파일 페이지에서 삭제됩니다.
- IBM Match 360에서 자산이 업데이트됩니다.
자세한 정보는 데이터 품질 점수를 참조하십시오.
데이터 품질 SLA 규칙 준수
하나 이상의 데이터 품질 SLA 규칙이 적용되는 자산의 경우 적용된 SLA 규칙이 해당 결과 및 마지막 평가 날짜와 시간과 함께 나열됩니다. 위반된 SLA 규칙의 경우 규칙 조건에 따라 테이블, 열 또는 둘 다에 있을 수 있는 위반 횟수와 규칙에 대한 조치가 구성되었는지 여부가 표시됩니다. 데이터 품질 수정 워크플로가 위반된 데이터 품질 SLA 규칙에 연결된 경우, 시작된 모든 수정 작업의 상태도 확인할 수 있습니다.
각 데이터 품질 SLA 규칙의 결과를 드릴다운할 수 있습니다. SLA 규칙의 품질 기준에서 차원 점수에 기여한 위반 및 점검에 대한 자세한 내용을 보려면 SLA 규칙의 이름을 클릭하세요. 위반 섹션에서는 위반이 발견된 요소, 정의된 품질 기준, 해당 요소의 실제 품질 점수 및 편차(% 포인트)에 대한 정보를 제공합니다. 필요한 권한이 있는 경우 규칙 세부 정보를 보거나 SLA 규칙을 편집할 수도 있습니다.
데이터 품질 SLA 규칙이 적용되지 않는 자산의 경우 이 섹션은 비어 있습니다.
데이터 품질 SLA 규칙 준수 또는 수정 작업에 대한 정보는 카탈로그에서 사용할 수 없습니다.
자산 레벨의 데이터 품질 검사 결과
여기서 자산에 대해 실행된 검사 및 결과를 확인할 수 있습니다. 목록은 날짜별로 정렬되며 가장 최근의 검사가 맨 위에 표시됩니다.
- 이름 및 로직
데이터 품질 규칙의 이름 및 규칙 로직을 포함하는 데이터 품질 정의의 이름 또는 사전 정의된 데이터 품질 검사의 이름입니다.
외부에서 관리되는 바인딩이 포함된 데이터 품질 규칙 또는 SQL 기반 데이터 품질 규칙은 해당 자산이 다음과 같은 해당 규칙에 관련 항목으로 추가되는 경우 자산의 데이터 품질 점수에 기여합니다. 데이터 품질을 검증합니다. 관계. 이 관계 유형과 링크된 모든 자산 및 열에 대해 동일한 점수 및 문제가 보고됩니다.
사전 정의된 데이터 품질 검사는 전체 자산에서 실행됩니다. 그러나 모두가 모든 열에 대한 결과를 리턴하는 것은 아닙니다. 예를 들어, 예측 값 검사는 숫자 열 또는 숫자 데이터가 있는 문자열 열의 이상치를 식별하지만 문자열 값이 있는 문자열 열의 결과는 리턴하지 않습니다. 따라서 사전 정의된 데이터 품질 검사의 목록은 개별 열에 대해 더 짧을 수 있습니다.
프로젝트에서 데이터 품질 검사의 이름을 클릭하여 세부사항을 확인할 수 있습니다. 사전 정의된 데이터 품질 검사의 경우 찾은 결과에 대한 정보를 보십시오. 문제가 있는 열과 품질 문제로 식별된 해당 열에 있는 값의 수 및 백분율입니다. 이러한 문제에 대해 출력 테이블이 설정된 경우 적절한 권한이 있는 사용자가 데이터로 인해 품질 문제가 발생하는 실제 행을 볼 수 있습니다. 데이터 품질 규칙의 경우 일반 규칙 구성을 보고 규칙의 출력 테이블 (구성된 경우) 에 대한 액세스 권한을 가질 수 있습니다. 규칙 구성을 업데이트하고 필요한 권한이 있는 경우 데이터 품질 규칙 보기를 클릭하여 자산으로 직접 이동할 수 있습니다.
연결된 IBM Match 360 엔티티 데이터 자산의 경우 잠재적 일치 가 일치를 위해 여기에 표시됩니다. 이 유형의 검사에 대한 추가 정보가 제공되지 않습니다.
- 유형
데이터 품질 규칙, 일치또는 프로파일링이 될 수 있는 검사 유형입니다. IBM Match 360 결과에 대해 일치 가 표시됩니다. 메타데이터 인리치먼트의 컨텍스트에서 실행된 사전 정의된 데이터 품질 검사에 대해 프로파일링 이 표시됩니다. 사전정의된 데이터 품질 검사를 참조하십시오.
- 차원
이 검사가 연결된 데이터 품질 차원입니다. 프로파일링 중에 또는 메타데이터 강화의 일부로 실행되는 사전 정의된 데이터 품질 검사에는 기본 차원이 지정되어 있습니다. 데이터 품질 규칙의 경우 필요에 따라 차원을 지정합니다.
연결된 IBM Match 360 엔티티 데이터 자산의 경우 엔티티 신뢰도 차원이 표시됩니다.
차원이 설정되지 않은 경우 필드에 없음이 표시됩니다. 자세한 정보는 데이터 품질 차원 및 데이터 품질 점수를 참조하십시오.
- 문제가 있는 데이터의 집중 및 관리 백분율
검사 유형에 따라 초점은 하나 이상의 열 또는 전체 테이블이 될 수 있습니다. 사전 정의된 데이터 품질 검사의 경우, 초점은 항상 전체 테이블입니다. 문제가 있는 데이터의 백분율 은 검사에 정의된 품질 기준을 충족하지 않는 데이터의 양을 표시합니다.
- 확인된 데이터 및 발견된 문제
확인된 레코드 수 및 발견된 품질 문제 수입니다. 이러한 문제는 동일하거나 다른 레코드에 있을 수 있습니다.
- 샘플링
마지막 검사 실행에 적용된 샘플링의 종류입니다. 데이터 품질 규칙의 경우 샘플링이 구성되지 않으면 이 열에 대시 (-) 가 표시됩니다. 일치를 위해 열은 항상 대시를 표시합니다. 사전 정의된 데이터 품질 검사의 경우 열에는 항상 값이 있습니다.
- 스코어
자산에 대해 검사에서 리턴한 품질 점수입니다.
- 전체 점수에 기여
이 설정은 이 특정 품질 점수가 전체 점수의 계산에서 고려되는지 여부를 판별합니다. 프로젝트에서만 이 설정을 변경할 수 있습니다. 이를 수행하려면 프로젝트 관리자 또는 편집자여야 합니다. 카탈로그에서 설정이 잠겨 있습니다. 데이터 품질 점수를 참조하십시오.
- 최근 선택
검사가 마지막으로 실행된 날짜 및 시간입니다.
열을 클릭하여 열 개요로 전환할 수 있습니다.
프로젝트에는 데이터 품질 구성요소가 다음과 같은 경우 새로운 데이터 품질 정의 또는 데이터 품질 규칙을 생성할 수 있는 옵션도 있습니다.IBM Knowledge Catalog 사용 가능. 프로젝트 관리자 또는 편집자여야 하며 데이터 품질 자산 관리 권한이 있어야 합니다.
열 개요
개별 열에 대한 데이터 품질 정보를 보십시오.
- 열 이름입니다.
- 열의 전체 데이터 품질 점수입니다.
- 자산에 적용 가능한 모든 차원에 대한 열의 품질 점수입니다. 차원에 기여한 해당 열에 적용된 검사가 없는 경우에는 대시 (-) 가 표시됩니다.
- 열에서 실행된 검사 수입니다.
- 열의 데이터 품질 점수가 전체 자산 점수 및 차원 점수의 계산에서 고려되는지 여부입니다. 프로젝트 관리자 또는 편집자로서 해당 설정을 변경할 수 있습니다.
- 열이 마지막으로 검사된 시간입니다.
그런 다음 각 열의 데이터 품질 세부사항으로 드릴 다운할 수 있습니다. 열에 대한 데이터 품질 정보를 참조하십시오.
검사를 클릭하여 데이터 품질 검사 목록으로 돌아갈 수 있습니다.
열에 대한 데이터 품질 정보
열의 데이터 품질 정보에 액세스할 때 전체 데이터 품질 점수를 표시하는 섹션이 표시되고 열에서 실행된 데이터 품질 검사 결과에 대한 액세스 권한이 있습니다. 일치는 열 레벨 데이터에 기여하지 않습니다.
품질 정보 외에도 열에 지정된 데이터 클래스 및 비즈니스 용어를 볼 수 있습니다.
열 수준의 전체 점수
품질 점수의 그래픽 표시는 열에 적용되는 차원과 관련하여 열의 전체 품질 및 품질 레벨을 한 눈에 볼 수 있는 보기를 제공합니다. 이러한 점수의 경우 추세 정보는 시간 경과에 따라 차원의 전체 품질 또는 품질 점수가 변경되는 방식을 표시합니다. 추세가 30, 90또는 180일동안 표시되는지 여부를 선택할 수 있습니다.
열 또는 차원의 전체 점수는 열에 적용된 데이터 품질 검사에서 제공되는 점수의 가중 평균입니다.
프로젝트에서 열에 영향을 주는 데이터 품질 검사가 자산에서 실행될 때마다 전체 및 차원 점수와 추세 정보가 다시 계산됩니다. 또한 열에 영향을 주는 검사에 대한 전체 점수에 기여 설정을 변경하거나 데이터 품질 규칙 또는 자산 프로파일이 삭제될 때 점수가 다시 계산됩니다.
카탈로그에서 전체 및 차원 점수와 추세 정보는 프로젝트에서 자산이 공개될 때 업데이트됩니다.
자세한 정보는 데이터 품질 점수를 참조하십시오.
열 레벨의 데이터 품질 검사 결과
여기서 열에 적용된 검사와 결과를 확인할 수 있습니다. 목록은 날짜별로 정렬되며 가장 최근의 검사가 맨 위에 표시됩니다.
- 이름 및 로직
데이터 품질 규칙의 이름 및 규칙 로직을 포함하는 데이터 품질 정의의 이름 또는 사전 정의된 데이터 품질 검사의 이름입니다.
외부에서 관리되는 바인딩이 포함된 데이터 품질 규칙 또는 SQL 기반 데이터 품질 규칙은 해당 열이 해당 규칙에 관련 항목으로 추가되는 경우 해당 열의 데이터 품질 점수에 기여합니다. 데이터 품질을 검증합니다. 관계. 이 관계 유형과 링크된 모든 자산 및 열에 대해 동일한 점수 및 문제가 보고됩니다.
프로젝트에서 데이터 품질 규칙의 이름을 클릭하여 일반 규칙 구성 및 규칙의 출력 테이블 (구성된 경우) 을 볼 수 있습니다. 규칙 구성을 업데이트하고 필요한 권한이 있는 경우 데이터 품질 규칙 보기를 클릭하여 자산으로 직접 이동할 수 있습니다.
- 유형
데이터 품질 규칙 또는 프로파일링이 될 수 있는 검사 유형입니다. 메타데이터 인리치먼트의 컨텍스트에서 실행된 사전 정의된 데이터 품질 검사에 대해 프로파일링 이 표시됩니다. 사전정의된 데이터 품질 검사를 참조하십시오.
- 차원
이 검사가 연결된 데이터 품질 차원입니다. 프로파일링 중에 또는 메타데이터 강화의 일부로 실행되는 사전 정의된 데이터 품질 검사에는 기본 차원이 지정되어 있습니다. 데이터 품질 규칙의 경우 필요에 따라 차원을 지정할 수 있습니다. 차원이 설정되지 않은 경우 필드에 기타가 표시됩니다. 자세한 정보는 데이터 품질 차원 및 데이터 품질 점수를 참조하십시오.
- 문제가 있는 데이터 비율
이 값은 검사에 정의된 품질 기준을 충족하지 않는 데이터의 양을 표시합니다.
- 확인된 데이터 및 발견된 문제
확인된 레코드 수 및 발견된 품질 문제 수입니다. 이러한 문제는 동일하거나 다른 레코드에 있을 수 있습니다.
- 샘플링
마지막 검사 실행에 적용된 샘플링의 종류입니다. 데이터 품질 규칙의 경우 샘플링이 구성되지 않으면 이 열에 대시 (-) 가 표시됩니다. 사전 정의된 데이터 품질 검사의 경우 열에는 항상 값이 있습니다.
- 스코어
검사가 열에 대해 리턴한 품질 점수입니다.
- 전체 점수에 기여
이 설정은 이 특정 품질 점수가 전체 점수의 계산에서 고려되는지 여부를 판별합니다. 프로젝트에서만 이 설정을 변경할 수 있습니다. 이를 수행하려면 프로젝트 관리자 또는 편집자여야 합니다. 카탈로그에서 설정이 잠겨 있습니다. 데이터 품질 점수를 참조하십시오.
- 최근 선택
검사가 마지막으로 실행된 날짜 및 시간입니다.
데이터 품질을 위한 IBM Knowledge Catalog API
REST API 콜렉션을 사용하여 데이터 품질 정보를 생성하고 검색할 수 있습니다.
- 데이터 품질 자산 메소드
데이터 품질 자산은 데이터 품질 검사의 대상이 되는 데이터 자산입니다. 샘플 API: 데이터 품질 자산 가져오기 - 데이터 품질 검사
데이터 품질 검사는 예를 들어 데이터 품질 규칙 또는 메타데이터 강화의 일부로 실행되는 검사일 수 있습니다. 샘플 API: 데이터 품질 검사 받기 - 데이터 품질 차원
표준 데이터 품질 차원 세트가 제품과 함께 제공되지만 사용자 정의 차원을 작성할 수 있습니다. 샘플 API: 데이터 품질 차원 목록 가져오기 - 데이터 품질 문제
데이터 품질 문제는 데이터 자산에 대해 데이터 품질 검사에서 발견된 문제입니다. 샘플 API: 데이터 품질 문제 목록 가져오기 - 데이터 품질 점수
각 데이터 자산에 대해 다른 유형의 품질 점수 (예: 전체 점수 또는 차원 점수) 가 생성됩니다. 샘플 API: 지정된 자산에 대한 데이터 품질 점수 목록 가져오기
자세한 정보
상위 주제: 데이터 품질 관리