0 / 0
영어 버전 문서로 돌아가기
IBM Match 360 의 데이터 개념
마지막 업데이트 날짜: 2024년 11월 26일
IBM Match 360 의 데이터 개념

IBM Match 360 은 하나 이상의 데이터 자산에서 제공하는 레코드에 대해 일치 알고리즘을 실행하여 마스터 데이터 엔티티를 작성합니다. 엔티티 및 레코드는 사용자 정의할 수 있는 IBM Match 360 데이터 모델을 기반으로 정의되고 작성됩니다.

이 주제의 내용:

레코드 및 엔티티

각 엔티티는 개인, 조직 또는 기타 엔티티의 360도 보기를 제공하는 마스터 데이터 오브젝트입니다. 하나 이상의 데이터 레코드가 단일 엔티티에 기여할 수 있습니다.

  • 레코드 는 단일 데이터 소스에서 가져온 개인 또는 조직의 단일 관점을 나타내는 인구 통계 정보 세트입니다. 동일한 개인 또는 조직이 여러 데이터 소스에 나타나면, 일치 알고리즘을 통해 각 레코드가 단일 엔티티로 함께 연계됩니다. 레코드는 개인 또는 조직을 설명하는 속성 및 필드 값으로 이루어집니다.

  • 마스터 데이터 엔티티 는 IBM Match 360 이 함께 일치하는 것으로 판별하는 레코드의 컴포지션입니다. 데이터 모델은 두 개의 엔티티 범주 (ID 또는 연관) 를 정의할 수 있습니다. 각 엔티티에는 일치 알고리즘이 함께 링크한 하나 이상의 멤버 레코드가 포함되어 있습니다. IBM Match 360 표현되는 엔티티를 정확하게 설명하는 가장 가능성이 높은 속성 및 필드 값 집합을 지능적으로 결정하여 마스터 데이터 워크스페이스 뷰에 표시합니다.

하나 이상의 구성원 레코드가 엔티티 보기에 제공될 수 있습니다. 일치 알고리즘이 다른 설정 (예: 다른 자동 링크 임계값 또는 다른 일치 속성 선택사항 세트) 으로 다시 실행되는 경우 엔티티를 구성하는 멤버 레코드가 변경될 수 있습니다.

단일 레코드로 이루어진 엔티티가 있을 수 있습니다. 이 경우 엔티티를 싱글톤이라고 합니다.

각 엔티티는 센터 레코드주위에 빌드됩니다. 엔티티에서 가장 오래된 레코드는 가운데 레코드로 간주됩니다. 센터 레코드는 엔티티의 기초이며 링크 해제하거나 다른 엔티티로 이동할 수 없습니다.

엔티티에 기여하는 각 레코드는 일치 처리에 의해 판별된 대로 레코드와 엔티티 사이의 그래프 에지로 표시됩니다. 일치 알고리즘을 다시 실행하면 링크를 나타내는 에지가 업데이트됩니다.

엔티티 유형

데이터 모델에서 새 엔티티 유형을 정의할 때 이 엔티티의 목적을 결정해야 합니다.

  • ID 엔티티는 모두 동일한 실제 사용자, 조직 또는 오브젝트를 나타내는 것으로 나타나는 레코드를 링크합니다. 그들은 공통의 정체성을 공유합니다. 예를 들어, 비즈니스 파트너 엔티티를 사용하여 데이터 내에서 동일한 실제 회사를 나타내는 조직 레코드를 일치시킬 수 있습니다.

  • 연관 엔티티는 공유 주소, 고용주 또는 구매 결정과 같은 다른 이유로 연관되어야 하는 레코드를 링크합니다. 연관 엔티티 유형의 한 가지 일반적인 예는 가정입니다. 지정된 가정의 구성원과 일치하는 가정 엔티티 유형을 단일 엔티티로 작성할 수 있습니다. 하우스홀딩 엔티티를 사용하여 가정별로 동작 및 활동을 추적하고 분석할 수 있습니다.

하우스홀딩 엔티티

다음 비디오를 보고 연관 엔티티를 사용하여 IBM Match 360 데이터 내에서 가정을 식별하는 방법을 확인하십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

가족을 공유하는 개인 레코드를 추적하고 식별하는 데 도움이 되는 연관 엔티티 유형을 작성할 때 고려해야 할 몇 가지 중요한 요인이 있습니다. 가정 기준을 설정하는 것은 가정을 관리하고 형성하는 데 중요한 첫 번째 단계입니다. 가정은 명시적 기준, 표현된 기준 또는 둘의 조합으로 정의할 수 있습니다.

명시적 기준 은 데이터 모델에 모든 속성을 포함할 수 있습니다. 다음은 하우스홀딩 전략에서 고려할 수 있는 명시적 기준의 예입니다.

  • 당사자는 지정된 주소 유형의 동일한 주소 (예: 동일한 집 주소) 를 공유합니다.
  • 당사자는 성을 공유합니다.
  • 당사자가 정의된 연령 범위 내에 있습니다.
  • 당사자는 집 전화번호와 같은 연락 방법을 공유합니다.
  • 당사자에게는 가족 관계와 같은 특정 유형의 관계가 있습니다.
  • 당사자는 계약의 컨텍스트에서 특정 역할을 갖습니다. 예를 들어, 상위에는 하위가 소유한 계정에 대한 법적 대리인 역할이 있을 수 있습니다.

명시적 기준을 사용하여 일치 알고리즘으로 가정을 빌드하십시오. IBM Match 360 을 사용하여 가정 엔티티를 알고리즘 방식으로 빌드하려면 선택한 명시적 기준을 이 엔티티 유형의 일치 속성으로 선택하십시오. 일치 알고리즘 구성에 대한 정보는 마스터 데이터 엔티티를 작성하기 위해 데이터 일치를 참조하십시오.

표현된 기준 에는 데이터 모델의 일부가 아닌 기타 정보가 포함되어 있습니다. 표현된 기준은 가족 구성원 또는 에이전트가 구두로 전달했을 수 있습니다. 다음은 하우스홀딩 전략에서 고려할 수 있는 표현된 기준의 예입니다.

  • 당사자는 동일한 가정 내에 있음을 전달합니다.
  • 에이전트가 고객 계정의 초기 설정 중에 가정 정보를 수집했습니다.

표시된 기준을 기반으로 가정 엔티티를 빌드하려면 수동으로 레코드를 링크하여 엔티티를 구성해야 합니다. 마스터 데이터 작업 영역을 사용하여 레코드의 연결 규칙을 편집하여 수동 레코드 링크를 만들 수 있습니다. 자세한 정보는 IBM Match 360 with Watson에서 마스터 데이터 엔티티 및 레코드 탐색을 참조하십시오.

엔티티의 속성 값 판별

마스터 데이터 엔티티에는 두 개의 속성 카테고리가 포함될 수 있습니다.

  • 엔티티의 구성원 레코드에서 값이 구성되는 속성입니다.
  • 값이 엔티티에 직접 저장되는 속성 ( 엔티티 속성이라고 함).
구성된 속성
엔티티는 구성원 레코드에 정의된 값에서 많은 속성 값을 파생시킵니다. 엔티티의 속성 값은 속성 작성 규칙 세트를 사용하여 해당 구성원 레코드에서 선택됩니다. 데이터 모델의 각 엔티티 유형에 대한 속성 컴포지션 규칙을 정의하고 사용자 정의할 수 있습니다. 속성 컴포지션에 대한 자세한 정보는 IBM Match 360에서 속성 컴포지션 규칙 정의를 참조하십시오.
엔티티 속성
엔티티 속성은 해당 멤버 레코드에서 구성되는 것과 반대로 엔티티에서 직접 정의됩니다. 엔티티 유형의 데이터 모델에서 엔티티 속성을 정의하십시오. 데이터 모델 수정에 대한 정보는 데이터 모델 사용자 정의를 참조하십시오.
  • 엔티티 속성의 값을 변경하려면 엔티티를 직접 편집하십시오. 멤버 레코드를 편집해도 엔티티 속성의 값에는 영향을 주지 않습니다. 엔티티 편집에 대한 정보는 IBM Match 360에서 레코드 및 엔티티 추가 및 편집을 참조하십시오.
  • 일치하는 알고리즘으로 엔티티를 처음 작성할 때 엔티티 속성 값이 정의되어 있지 않습니다. 마스터 데이터 작업 영역에서 엔티티를 편집하여 엔티티 속성에 대한 값을 제공합니다.
  • 채워진 엔티티 속성 값이 있는 엔티티가 수동 링크 또는 링크 해제 조치를 통해 또는 일치 알고리즘에 대한 변경을 통해 컴포지션 변경의 결과로 삭제되는 경우 해당 엔티티 속성 값이 생존 엔티티로 전송됩니다.
  • 두 엔티티 모두에 엔티티 속성이 있는 두 엔티티가 병합되는 경우 (일치하거나 수동으로 링크됨) 생존 엔티티 ID의 엔티티 속성 값이 우선합니다. 문제의 속성이 값 목록으로 구성된 경우 시스템은 두 엔티티의 목록을 병합합니다. 병합은 목록에 중복 값이 포함되지 않도록 합니다. 두 목록이 모두 동일한 값을 포함하는 경우 해당 값은 병합된 목록에서 한 번만 표시됩니다.

엔티티 지속성

데이터 모델을 정의할 때 각 엔티티 유형의 복합 보기를 데이터베이스에 저장할지 아니면 해당 멤버 레코드에서 필요에 따라 구성할지 구성할 수 있습니다. 엔티티 유형이 지속되도록 구성되면 각 엔티티의 합성된 속성이 레코드 속성이 저장되는 방식과 유사하게 데이터베이스에 저장되므로 엔티티 데이터가 더 안정적이고 복원력이 높아집니다.

엔티티가 지속되도록 구성되면 데이터 관리자와 비즈니스 사용자는 보충 속성, 감사 속성, 레코드 수 및 엔티티 ID와 같은 시스템 속성을 포함한 엔티티 데이터를 직접 검색할 수 있습니다. 사용자는 마스터 데이터 탐색기 인터페이스의 단순 또는 고급 검색 메커니즘을 사용하여 지속되는 엔티티를 검색할 수 있습니다.

마스터 데이터의 엔터티 볼륨에 따라 데이터베이스에 엔터티 복합 뷰를 저장하면 데이터베이스의 크기가 크게 증가할 수 있습니다.

엔티티 유형 정의에 대한 자세한 내용은 데이터 모델 사용자 지정을 참조하세요.

IBM Match 360 데이터 모델

데이터 모델은 IBM Match 360에 로드되는 데이터와 연관된 메타데이터를 정의합니다.

데이터 모델에는 데이터에 있는 정보를 식별하고 분류하기 위해 IBM Match 360 에서 사용되는 특성 및 규칙이 포함되어 있습니다. 데이터 모델은 서로 다른 유형의 메타데이터로 구성됩니다.

조직의 요구사항에 맞게 사용자 고유의 레코드 유형, 속성 유형 및 관계 유형을 정의할 수 있습니다. 시스템 특성은 일반적으로 사용자 정의할 수 없습니다.

시스템 특성 (감사 속성)

데이터 모델의 시스템 특성은 IBM Match 360 에서 데이터를 감사하는 기능을 개선하여 데이터 거버넌스 규칙을 준수하도록 합니다. 시스템 특성은 시스템에서 정의, 캡처 및 저장되며 사용자 정의 또는 수정에 사용할 수 없습니다. 데이터 모델의 네 가지 다른 요소 (레코드 유형, 엔티티 유형, 속성 유형 및 관계 유형) 와 연관된 시스템 특성이 있습니다.

  • 레코드 유형 시스템 특성은 레코드 레벨에서 시스템 정보를 저장합니다. 예를 들어,

    • record_last_updated 는 각 레코드가 마지막으로 업데이트된 시간을 추적합니다.
    • record_number 는 각 레코드에 대해 시스템이 생성한 식별 번호를 저장합니다.
  • 엔티티 유형 시스템 특성은 엔티티 레벨에서 시스템 정보를 저장합니다. 예를 들어,

    • created_date 는 엔티티가 작성된 시간 및 날짜를 저장합니다.
    • link_last_updated_date 는 엔티티의 멤버 레코드가 마지막으로 변경된 시간 및 날짜를 추적합니다.
    • last_updated_date 는 엔티티의 보조 속성이 마지막으로 변경된 시간 및 날짜를 저장합니다.
    • last_updated_user 는 엔티티의 보충 속성을 가장 최근에 변경한 사용자를 추적합니다.
  • 속성 유형 시스템 특성은 속성 레벨에서 시스템 정보를 저장합니다. 예를 들어, attribute_last_updated 는 각 속성이 마지막으로 업데이트된 시간을 추적합니다.

  • 관계 유형 시스템 특성은 관계 레벨에서 시스템 정보를 저장합니다. 예를 들어,

    • relationship_last_updated 는 각 관계가 마지막으로 업데이트된 시간을 추적합니다.
    • relationship_number 는 각 관계에 대해 시스템이 생성한 식별 번호를 저장합니다.

레코드 데이터를 추가하거나 편집할 때 IBM Match 360 이 작성하는 시스템 생성 감사 속성을 보는 방법을 보려면 다음 비디오를 보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

레코드 유형

데이터 모델의 레코드 유형은 조직에 필요한 도메인 및 유스 케이스와 관련된 다양한 유형의 레코드를 정의합니다. 각 레코드 유형은 다음 특성 또는 오브젝트로 구성됩니다.

  • label 는 레코드 유형의 레이블입니다.
  • description 는 레코드 유형에 대한 간단한 설명입니다.
  • entity_types 에는 이 레코드 유형에 포함된 모든 엔티티 유형에 대한 오브젝트가 포함되어 있습니다. 각 entity_type 오브젝트에는 레이블, 설명 및 선택적으로 엔티티 유형 (ID 또는 연관) 이 포함됩니다.
  • attributes 는 레코드 유형과 연관된 모든 속성을 포함하는 오브젝트입니다. 정의된 각 속성에는 다음 특성이 포함되어 있습니다.
    • label -속성의 레이블입니다.
    • description -속성에 대한 설명입니다.
    • attribute_type -이 속성의 속성 유형입니다.
    • cardinality -속성의 카디널리티 (목록 또는 단일). 카디널리티는 이 속성이 가질 수 있는 값의 수를 정의합니다.
    • indexed -속성이 해당 컨텐츠의 자유 텍스트 검색을 지원하기 위해 색인화되는지 여부를 표시하는 부울 필드입니다.

속성 유형

데이터 모델의 속성 유형은 레코드 유형 또는 관계 유형과 연관될 수 있는 속성의 유형을 정의합니다. 각 속성 유형 항목은 다음 특성 또는 오브젝트로 구성됩니다.

  • label 는 속성 유형의 레이블입니다.
  • description 는 속성 유형에 대한 간단한 설명입니다.
  • matching_types 는 이 속성 유형의 모든 속성에 적용할 일치하는 함수의 유형을 표시합니다.
  • fields 에는 이 속성 유형의 일부인 모든 필드의 정의가 포함되어 있습니다. 각 필드는 label, descriptionindexed 특성으로 구성됩니다.

관계 유형

데이터 모델의 관계 유형은 이 데이터에서 할당할 수 있는 관계 유형을 정의합니다. 정의된 각 관계 유형에는 다음 특성 및 오브젝트가 포함됩니다.

  • label 는 관계 유형의 레이블입니다.
  • description 는 관계 유형에 대한 간단한 설명입니다.
  • label_from_source 는 소스의 관점에서 볼 때 관계에 대한 레이블입니다. 예를 들어, "Manages" 입니다.
  • label_from_target 은 대상의 관점에서 볼 때 관계에 대한 레이블입니다. 예를 들어, "보고 대상" 입니다.
  • cardinality 는 관계의 카디널리티를 정의합니다 (예: 일대다 또는 일대일).
  • directional 는 이 유형의 관계가 방향 (보고 있는 관계의 어느 쪽 (예: 의사/환자 관계) 에 따라 다름) 또는 양방향 (피어 관계와 같은 관계의 양쪽과 동일) 인지 여부를 표시합니다.
  • attributes 는 이 관계 유형의 일부인 모든 속성의 정의를 포함하는 오브젝트입니다. attributes 오브젝트의 구조는 레코드 유형의 속성에 대한 구조와 동일합니다.
  • rules 는 이 관계 유형에 대한 소스 및 대상 규칙을 정의하는 오브젝트입니다.
    • 소스 규칙의 오브젝트에는 이 유형의 관계를 작성하는 동안 소스로 사용할 수 있는 레코드 유형 및 엔티티 유형의 목록이 포함되어 있습니다.
    • 대상 규칙의 오브젝트에는 이 유형의 관계를 작성하는 동안 대상으로 사용할 수 있는 레코드 유형 및 엔티티 유형의 목록이 포함되어 있습니다.

자세한 정보

상위 주제: 마스터 데이터 관리

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기