0 / 0
영어 버전 문서로 돌아가기
일치 알고리즘 사용자 정의 및 강화(IBM Match 360)
마지막 업데이트 날짜: 2024년 11월 26일
일치 알고리즘 사용자 정의 및 강화(IBM Match 360)

IBM Match 360 with Watson 에는 데이터 엔지니어 사용자가 일치 알고리즘을 조정하고 사용자 정의하는 데 사용할 수 있는 도구가 포함되어 있습니다. 알고리즘을 조정하여 IBM Match 360이 마스터 데이터 엔티티를 작성하기 위해 데이터를 일치시키는 방법을 제어할 수 있습니다.

필수 권한
마스터 데이터 인스턴스를 구성하려면 IBM Match 360 서비스에 대한 DataEngineer 사용자 그룹의 구성원이어야 합니다.

알고리즘 구성 및 조정에는 다음과 같은 네 가지 주요 파트가 있습니다.

  • 일치하는 속성 선택. 일치 프로세스 중에 비교되는 데이터 모델 속성을 선택하여 알고리즘에 가장 중요한 고려사항이 되는 데이터 점을 IBM Match 360 with Watson에 알릴 수 있습니다. 강력한 차별 요소인 속성을 선택하는 것이 중요합니다. 면허증 번호와 같은 고유한 ID는 훌륭한 일치 속성입니다. 처음 일치를 실행하기 전에 일치하는 속성을 선택해야 합니다.

  • 쌍 검토 요청 및 완료. 쌍 검토를 요청하여 일치 알고리즘의 가중치 및 일치 임계값을 최적화하는 지능형 튜닝 권장사항을 생성하십시오. 쌍 검토 중에 데이터 스튜워드는 레코드 쌍을 비교하여 일치하는지, 일치하는지 또는 일치하지 않는지 여부를 판별합니다. 데이터 스튜워드의 응답은 결과 튜닝 권장사항을 알려줍니다.

  • 튜닝 권장사항 적용. 쌍 검토 태스크가 완료되면 데이터 엔지니어가 튜닝 권장사항을 적용할지 여부를 결정할 수 있습니다.

  • 자동 링크 및 직접 검토 임계값 정의. 쌍 검토에서 튜닝 권장사항을 승인하는 경우 자동 링크 및 사무 (clerical) 임계값이 자동으로 판별되지만 필요한 경우 항상 수동으로 임계값을 대체할 수 있습니다. IBM Match 360 이 완료하는 각 레코드 대 레코드 일치 비교는 일치 점수를 생성합니다. 이 점수는 0-100범위의 백분율 값으로 사용할 수 있습니다. 0은 명확한 비일치이고 100은 명확한 일치입니다. 일치 알고리즘 구성의 일부로 데이터 엔지니어는 두 개의 임계값을 정의할 수 있습니다.

    • autolink 임계값 은 임의의 두 레코드 간에 자동 일치 결정을 하기 위해 알고리즘에 대한 최소 일치 점수를 정의합니다.

      • 자동 링크 임계값이 낮으면 전체 일치가 더 많아지고 거짓 긍정 (false positive) 일치가 더 많아질 수 있습니다.
      • 자동 링크 임계값이 높으면 전체 일치 항목 수가 더 적고 싱글톤 엔티티 (단일 멤버 레코드만으로 구성됨) 가 더 많으며, 거짓 부정 (false negative) 불일치가 더 많을 수 있습니다.
    • 직접 검토 임계값 은 잠재적 일치에 대한 최소 일치 점수를 정의합니다. 직접 검토 임계값 미만의 점수는 불일치로 간주됩니다. 직접 검토 임계값과 자동 링크 임계값 사이의 범위에 속하는 점수는 데이터 스튜워드 사용자가 교정할 잠재적 일치 워크플로우를 통해 전송할 수 있습니다.

    일치하는 알고리즘 의사결정을 구성하기 위해 일치하는 임계값 정의
    일치 알고리즘 임계값

    중요: 일치하는 설정에서 사무 (clerical) 범위가 사용 가능하지 않은 경우 잠재적 일치 워크플로우는 태스크를 생성할 수 없습니다. 잠재적 일치 워크플로우에 대한 정보는 [마스터 데이터 워크플로우 구성] (m360-config-workflow.html) 을 참조하십시오.

IBM Match 360 REST API를 사용하는 고급 알고리즘 튜닝 프로시저에 대한 정보는 고급 일치 알고리즘 튜닝을 참조하십시오.

이 주제의 내용:

일치 알고리즘 조정 준비

데이터에 대한 일치를 아직 실행하지 않은 경우에는 일치를 실행하기 전에 먼저 일치 속성을 선택해야 합니다. 필요한 경우 선택사항을 변경할 수 있습니다.

한 번 이상 일치를 실행할 때까지 자동 링크 임계값 민감도 또는 요청 쌍 검토를 변경할 수 없습니다. 이 제한사항으로 인해 기본 민감도에서 임계값을 변경하기 위한 일부 비교 기준이 마련됩니다. 예를 들어, 데이터의 허위 양성 일치가 너무 많음을 알게 되면 민감도를 올릴 수 있습니다. 싱글톤 레코드가 너무 많으면 민감도를 낮출 수 있습니다.

일치하는 알고리즘 설정을 수정하기 전에 새 구성 스냅샷을 작성하여 현재 설정을 저장하는 것을 고려하십시오. 스냅샷을 작성하면 변경 결과가 만족스럽지 않은 경우 나중에 이전 구성으로 쉽게 되돌릴 수 있습니다. 스냅샷 작성에 대한 정보는 스냅샷을 사용하여 마스터 데이터 구성 설정 저장 및 로드를 참조하십시오.

일치 속성 선택

IBM Match 360이 일치 알고리즘에 사용하는 속성을 선택하려면 다음을 수행하십시오.

  1. 마스터 데이터 탐색 메뉴에서 일치 설정 ' 경기 설정 아이콘'을 클릭합니다.

  2. 매칭 알고리즘을 조정하려는 엔티티 유형을 선택합니다.

  3. 일치 설정 탭으로 이동하고 사이드바에서 속성 선택 을 선택하여 일치하는 데이터에 사용할 속성을 선택하십시오. 처음으로 이 탭으로 이동하면 IBM Match 360이 일치에 사용하기 위해 데이터 모델로부터 제안된 몇 가지 속성을 자동으로 생성합니다.

  4. 일치하는 속성 목록 및 해당 컴포넌트 필드를 검토하십시오. 이러한 속성 및 필드는 레코드 일치에 대한 비교의 기초로 사용되고 마스터 데이터 엔티티를 작성합니다. 목록에서 속성을 추가하거나 제거하려면 속성 편집을 클릭하고 필요에 따라 속성 및 해당 컴포넌트 필드를 선택하거나 지우십시오.

    일치 속성을 선택할 때 일치 강도 표시기를 사용하여 변경사항이 일치 알고리즘에 미치는 영향의 추정치를 볼 수 있습니다.

    데이터 모델에 사용자 정의 속성을 추가한 경우 기본적으로 일치를 고려하도록 선택되지 않습니다. 일치하는 사용자 정의 속성 유형을 사용하려는 경우 이를 선택한 후 고려할 필드를 지정해야 합니다. 필드를 지정하지 않으면 일치하는 알고리즘이 속성을 사용할 수 없습니다.

    사용자 정의되지 않은 (사전 정의) 속성 유형의 경우 고려할 필드를 지정하지 않으면 일치하는 알고리즘이 기본 필드 세트를 사용합니다.

  5. 일치하는 속성 변경사항에 만족하면 저장을 클릭하십시오.

  6. 업데이트된 설정에 따라 일치하는 엔티티를 다시 생성하십시오. 작업 표시줄에서 일치하는 아이콘 ' 일치 실행 아이콘 '을 클릭합니다.

일치 프로세스는 완료하는 데 약간의 시간이 소요됩니다. 백그라운드에서 실행하므로 사용자는 작업을 계속할 수 있습니다. 완료되면 통지를 받고 일치 결과 탭에서 결과의 세부사항을 검토할 수 있습니다.

쌍 검토 요청 및 튜닝 권장사항 적용

쌍 검토를 사용하여 일치 알고리즘을 조정하십시오. 각 조직에는 거짓 일치에 대한 서로 다른 레벨의 위험 허용 한도가 있으며, 쌍 검토는 올바른 일치 설정을 판별하는 데 도움이 될 수 있습니다.

데이터 엔지니어는 데이터 스튜워드가 쌍 검토를 완료하도록 요청한 후 결과 튜닝 권장사항을 승인할지 여부를 결정할 수 있습니다.

쌍 검토를 요청하려면 다음을 수행하십시오.

  1. 마스터 데이터 탐색 메뉴에서 일치 설정 ' 경기 설정 아이콘'을 클릭합니다.

  2. 매칭 알고리즘을 조정하려는 엔티티 유형을 선택합니다.

  3. 사이드바에서 알고리즘 튜닝 을 선택하여 알고리즘 튜닝 도구에 액세스하십시오.

  4. 쌍 검토 섹션에서 쌍 검토 요청을 클릭하십시오.

  5. 이 태스크의 일부로 검토해야 하는 레코드 쌍 수를 선택하십시오. 더 많은 쌍을 검토하면 성능 조정 권장사항이 향상됩니다. 너무 적은 수의 쌍을 검토하면 IBM Match 360 이 권장사항을 생성할 수 없습니다.

    주: 생성된 쌍의 실제 수는 이 단계에서 정의된 수와 일치하지 않을 수 있습니다. 생성된 레코드 쌍의 수는 시스템에서 사용 가능한 데이터 양 및 기타 요인에 따라 다릅니다.
  6. 요청 전송을 클릭하십시오.

IBM Match 360 은 레코드 쌍을 생성하고 쌍 검토 태스크를 작성하기 시작합니다. 알고리즘 튜닝 섹션에서는 사용자에게 검토 상태 (쌍 생성 또는 검토 진행 중) 를 알리고 현재 검토 태스크의 진행상태도 추적합니다.

데이터 스튜워드 사용자로 쌍 검토 태스크 완료에 대한 정보는 쌍 검토 완료를 참조하십시오.

쌍 검토에서 생성된 튜닝 권장사항을 검토하고 적용하려면 다음을 수행하십시오.

  1. 마스터 데이터 탐색 메뉴에서 일치 설정 ' 경기 설정 아이콘'을 클릭합니다.

  2. 매칭 알고리즘을 조정하려는 엔티티 유형을 선택합니다.

  3. 사이드바에서 알고리즘 튜닝 을 선택하여 알고리즘 튜닝 도구에 액세스하십시오.

  4. 쌍 검토 섹션에서 최신 쌍 검토 태스크의 진행상태를 검토하십시오. 검토된 총 쌍 수와 일치, 일치하지 않음 또는 불확실한 일치로 판별된 쌍 수를 볼 수 있습니다.

  5. 임계값 섹션에서 현재 일치 알고리즘 설정과 현재 거짓 긍정 (false positive) 및 거짓 부정 (false negative) 비율의 추정치를 검토하십시오.

    쌍 검토가 너무 적게 완료되었거나 일치가 아직 실행되지 않은 경우 거짓 긍정 (false positive) 및 거짓 부정 (false negative) 비율을 표시할 수 없습니다.

  6. 임계값 권장사항 섹션을 펼치십시오.

  7. 일치하는 알고리즘 설정에 대한 권장 업데이트를 검토하십시오. 권장사항은 검토한 쌍을 기반으로 가장 낮은 거짓 긍정 (false positive) 및 거짓 부정 (false negative) 비율의 임계값을 표시합니다.

  8. 권장 설정을 사용하려면 권장사항 적용을 클릭하십시오. 권장사항을 적용하면 자동 링크 민감도와 각 속성의 연관된 일치 가중치가 변경됩니다.

  9. 업데이트된 설정에 따라 일치하는 엔티티를 다시 생성하십시오. 매칭 결과 탭으로 이동한 다음 작업 표시줄에서 매칭 실행 아이콘 ' 일치 실행 아이콘 '을 클릭합니다.

일치 프로세스는 완료하는 데 약간의 시간이 소요됩니다. 백그라운드에서 실행하므로 사용자는 작업을 계속할 수 있습니다. 완료되면 통지를 받고 일치 결과 탭에서 결과의 세부사항을 검토할 수 있습니다.

다음 단계

자세한 정보

상위 주제: 마스터 데이터 구성하기

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기