엔티티 데이터의 잠재적 레코드 일치를 검토하고 평가하십시오. 링크 또는 링크 해제 의사결정을 수행하여 데이터 품질을 개선하고 엔티티 데이터의 신뢰도를 높이십시오.
IBM Cloud Pak for Data의 데이터 품질 기능과 IBM Match 360 서비스를 사용하여 기업 데이터 내의 데이터 품질 문제를 식별, 이해, 에스컬레이션, 수정 및 예방할 수 있습니다.
이 주제의 내용:
시작하기 전에
잠재적 일치 태스크를 생성하고 이를 수정하기 전에 데이터 엔지니어 사용자가 다음 태스크를 완료해야 합니다.
- 직접 검토 범위를 사용으로 설정하고 직접 검토 및 자동 링크 임계값을 구성하십시오. 자세한 정보는 일치 알고리즘 사용자 정의 및 강화를 참조하십시오.
- 이 서비스 인스턴스에 대한 잠재적 일치 워크플로우를 구성하고 활성화하십시오. 자세한 정보는 IBM Match 360 워크플로우 구성을 참조하십시오.
자산 데이터 품질 및 엔티티 신뢰도 보기
프로젝트 소유자 및 협업자는 데이터 자산에 대한 데이터 품질 정보를 볼 수 있습니다. 데이터 품질 정보는 프로젝트의 자산 데이터 품질 탭에서 액세스할 수 있는 일련의 차원 점수로 요약됩니다.
데이터 품질 평가에 기여하는 차원 중 하나는 엔티티 신뢰도입니다. 엔티티 신뢰도 차원은 연결된 IBM Match 360 엔티티 데이터 자산에 대해서만 보고됩니다. 엔티티 신뢰도 점수는 IBM Match 360 이 올바르고 완료되었다고 확신하는 시스템에 있는 마스터 데이터 엔티티의 백분율을 나타냅니다.
일치 알고리즘을 튜닝하거나 잠재적인 일치 문제를 수정하여 자산의 엔티티 신뢰도 점수를 개선할 수 있습니다.
데이터 품질에 대한 자세한 정보는 데이터 자산에 대한 데이터 품질 정보를 참조하십시오.
자산의 엔티티 신뢰도 점수가 낮은 경우 일부 잠재적 일치 태스크를 생성하고 수정하여 데이터의 이점을 얻을 수 있습니다.
데이터 품질 정보 및 엔티티 신뢰도 점수를 보려면 다음을 수행하십시오.
- Cloud Pak for Data 탐색 메뉴에서 프로젝트 > 모든 프로젝트를 선택하십시오. 프로젝트 페이지에서 IBM Match 360 프로젝트를 선택하십시오.
- 프로젝트의 자산 탭을 클릭한 후 데이터 품질 분석을 보려는 연결된 마스터 데이터 자산을 선택하십시오.
- 데이터 품질 탭을 선택하십시오. 데이터 품질 보고서를 생성하고 표시하는 데 시간이 걸릴 수 있습니다.
- 데이터 품질 보고서가 사용 가능하면 엔티티 신뢰도 점수를 검토하십시오.
잠재적 일치 문제에 대한 태스크 생성
데이터의 일치된 엔티티 내에서 잠재적인 문제를 검토하고 수정하기 전에 몇 가지 잠재적인 일치 태스크를 생성해야 합니다. 전체 데이터 세트 또는 검색 결과 세트에서 태스크를 생성하여 태스크 범위를 좁힐 수 있습니다. 예를 들어, 데이터 스튜워드의 태스크 받은 편지함이 과도하지 않도록 특정 지리적 영역에 조치방안 태스크를 집중하도록 선택할 수 있습니다.
- 필수 권한
- 잠재적 일치 태스크를 작성하고 수정하려면 IBM Match 360 서비스에 대한 데이터 엔지니어 또는 데이터 스튜워드 사용자 그룹의 구성원이어야 합니다.
잠재적 일치 조치방안 태스크를 생성하려면 다음을 수행하십시오.
마스터 데이터 탐색 메뉴에서 ' ' 검색을 클릭하여 마스터 데이터 검색 페이지를 엽니다.
선택적으로 검색을 실행하여 데이터 범위를 좁히십시오. 검색에 대한 자세한 정보는 IBM Match 360에서 마스터 데이터 엔티티 및 레코드 탐색을 참조하십시오.
태스크 작성을 클릭하십시오.
조치방안 태스크 작성의 매개변수를 정의하십시오.
- 모든 데이터에 대한 태스크를 작성할지 또는 현재 검색의 결과 (적용 가능한 경우) 를 작성할지 여부를 정의하십시오.
- 이러한 태스크에 포함할 엔티티 유형을 선택하십시오.
- 이 조치 중에 작성할 태스크 수를 정의하십시오.
태스크 작성 을 클릭하여 조치방안 태스크 생성을 시작하십시오.
태스크가 준비되면 지정된 사용자의 태스크 받은 편지함에 잠재적 일치 수정 태스크로 표시됩니다. 사용자 지정은 워크플로우 구성에서 정의됩니다.
생성된 잠재적 일치 개선 태스크에 포함된 엔티티가 수동으로 또는 일치 프로세스를 통해 업데이트되는 경우 Cloud Pak for Data 는 자동으로 해당 태스크를 무효화하고 제거합니다. 일치하는 업데이트 후에도 여전히 잠재적인 일치 문제가 있는 경우 태스크 생성 프로시저를 반복하여 태스크를 다시 작성할 수 있습니다.
잠재적 일치를 수정하기 위한 태스크 완료
데이터 스튜워드 사용자는 작업 받은 메일함에 잠재적 일치 문제가 있는 경우 해당 문제를 청구하고 식별된 데이터 품질 문제를 수정할 수 있습니다.
잠재적 일치 문제를 해결하려면 다음을 수행하십시오.
Cloud Pak for Data 탐색 메뉴에서 통제 > 태스크 받은 편지함을 선택하십시오. 작업 받은 문서가 열리고 지정되거나 완료된 작업이 표시됩니다.
받은 편지함에 잠재적 일치 수정 태스크가 있는지 확인하십시오.
필터 아이콘 ' '을 클릭하면 받은 편지함의 범위를 좁히는 데 사용할 수 있는 필터 옵션에 액세스할 수 있습니다. 예를 들어, 조치방안 태스크만 표시하려면 태스크 유형에서 조치방안을 선택한 후 적용을 클릭하십시오. 또한 만기 날짜 또는 지정된 날짜별로 작업 받은 문서를 정렬할 수도 있습니다.
태스크에 대한 작업을 시작하려면 태스크를 열고 태스크 청구를 클릭하십시오. 태스크를 청구할 때 시스템은 다른 사용자가 태스크에 대해 작업하는 것을 방지합니다.
태스크의 요약 세부사항을 검토하십시오.
문제 수정 을 클릭하여 태스크에서 식별된 레코드 비교를 시작하십시오. 이 잠재적 일치 태스크와 관련된 모든 레코드 및 엔티티를 시각적으로 표시하는 그래픽 보기가 열립니다. 레코드 간의 잠재적 일치는 점선으로 표시됩니다.
선택적으로 각 레코드를 클릭하여 해당 세부사항을 보십시오.
잠재적 일치 패널에 이 태스크에 포함된 각 잠재적 일치 의사결정에 대한 항목이 표시됩니다. 각 항목을 클릭하여 세부사항을 검토하십시오. 결정을 내리는 데 도움이 되도록 관련 레코드를 나란히 비교하여 표시됩니다.
대량 조치 사용 가능이라는 메시지가 표시되면 시스템이 이 태스크의 모든 문제에 적용되는 대량 의사결정 ( 링크 또는 링크 해제) 을 수행할 수 있음을 판별한 것입니다. 미리보기 를 클릭하여 의사결정을 수행하기 전에 변경사항이 표시되는 모양의 시각화를 확인하십시오.
엔티티 표시 를 클릭하여 비교 패널을 펼치십시오.
태스크의 각 의사결정에 대해 수행할 조치 (수동 링크 (링크), 수동 링크 해제 (링크 해제) 또는 문제 건너뛰기 (건너뛰기)) 를 선택할 수 있습니다. 가능한 경우, 시스템은 각 권장사항에 대한 신뢰도 점수를 제공하는 지능형 권장사항을 제공합니다.
최종 결정을 내리기 전에 미리보기 를 클릭하여 엔티티 및 레코드 구조의 모양을 시각화할 수도 있습니다.
의사결정을 한 후 링크, 링크 해제또는 건너뛰기를 클릭하여 모달에서 이를 확인하십시오.
팁: 변경사항이 시스템의 데이터에 아직 적용되지 않았습니다. 제출 을 클릭하여 변경사항을 적용하십시오.제출 을 클릭하여 변경사항을 적용하고 이 태스크를 완료하십시오. 거부를 클릭하면 변경사항이 작성되지 않습니다.
태스크 받은 편지함에서 완료 를 클릭하여 태스크의 일부로 완료한 각 활동에 대한 세부사항을 포함하여 완료한 모든 태스크의 목록을 보십시오.
자세한 정보
- 워크플로우 태스크 모니터링
- IBM Match 360의 마스터 데이터 엔티티 및 레코드 탐색
- 기록 및 엔티티 연결 유지
- 마스터 데이터 워크플로우 구성
- 일치 알고리즘 사용자 정의 및 강화
상위 주제: 마스터 데이터 탐색