자동 용어 지정

자동 용어 지정은 비즈니스 용어를 자산에 자동으로 맵핑하는 프로세스입니다. 용어는 메타데이터 강화의 일부로 자산에 자동으로 지정될 수 있습니다.

프로젝트 또는 카탈로그에서 자산 특성을 편집하거나 강화 결과 작업을 수행할 때 수동으로 비즈니스 용어를 지정할 수 있습니다.

자동 용어 지정이 메타데이터 강화의 일부로 구성된 경우 이러한 지정은 여러 서비스에 의해 생성됩니다. 이러한 서비스는 지정할 용어에 대한 제안도 생성합니다.

신뢰수준에 따라 용어가 지정됩니다. 처음에는 이러한 연관이 도메인 전문가 및 스튜어드가 수동으로 검토하고 지정할 수 있는 후보로 표시됩니다. 용어가 제안되거나 자동으로 지정될 때의 신뢰수준은 프로젝트의 강화 설정에 의해 결정됩니다. 초과되는 기본 신뢰도는 용어 제안의 경우 75%, 후보 항 자동 지정의 경우 90%입니다.

공개된 비즈니스 용어만 지정할 수 있습니다.

용어 지정을 생성하는 데 사용되는 서비스

다음 서비스가 용어 지정을 생성하는 데 사용됩니다.

  • 클래스 기반 지정 서비스는 데이터 분류를 기반으로 지정을 생성합니다. 데이터 클래스가 열 분석의 결과 또는 수동으로 자산에 대해 선택된 경우 및 이 데이터 클래스가 하나 이상의 비즈니스 용어에 링크된 경우, 이러한 용어가 각각의 임계값을 초과하는 경우 제안되거나 지정됩니다. 용어 신뢰수준은 용어가 링크된 데이터 클래스의 신뢰도와 동일합니다. 예를 들어, 이메일 주소로 분류된 COL1 열은 데이터 클래스 및 용어가 링크된 경우 이메일 주소라는 용어에 지정될 수 있습니다.

    클래스 기반 지정 서비스를 사용 가능하게 하려면, 적절한 연계가 고품질 결과를 위한 중요한 전제조건이기 때문에 용어 지정을 실행하기 전에 데이터 클래스를 용어 연계로 검토하는 것이 중요합니다.

    사전 정의된 데이터 클래스 코드, ID, 날짜, 텍스트, 표시기, 수량 및 부울에 링크된 비즈니스 용어는 용어 지정에 대해 고려되지 않습니다.

  • 머신 러닝(ML) 서비스는 프로젝트당 하나의 감독 머신 러닝 모델을 사용하여 용어를 지정합니다. 모델은 초기에 그 프로젝트에서 ML 서비스의 첫 번째 사용에 대해 훈련됩니다. 프로젝트 및 프로젝트의 검토된 열에 대해 사용 가능한 용어 지정에 사용할 수 있는 카테고리에서 공개된 비즈니스 용어를 사용하여 훈련됩니다. 사용 가능한 용어 지정이 없는 경우, 훈련은 용어 및 자산에 대한 설명 및 설명의 언어적 유사성에 중점을 둡니다. 해당 유사성에 따라 용어를 지정할 수 있습니다. 마지막 훈련 이후로 표시된 모든 20개의 열에 대해 모델은 새 수동 및 확인된 자동 지정을 기반으로 재훈련됩니다. 재훈련은 새로운 용어가 공개될 때도 발생합니다.

프로젝트 관리자는 용어 지정 서비스에 대한 일부 설정을 사용자 정의할 수 있습니다. 기본 강화 설정을 참조하십시오.

전체 신뢰도가 어떻게 계산되는지

용어를 데이터 자산과 연관시키는 서비스는 신뢰도를 계산합니다. 이 값은 구성 가능한 최소값과 1사이의 숫자 값입니다. 최소 값은 용어 지정에 대한 제안 임계값 설정으로 용어가 일치해야 하는 백분율 임계값으로 구성됩니다.

지정되거나 제안된 용어에 대한 신뢰도는 백분율 값으로 표시됩니다. 이 값은 다음 값의 최대값인 전체 신뢰도를 나타냅니다.

  • 클래스 기반 지정에서 리턴된 신뢰도 값
  • ML 기반 지정에서 리턴된 신뢰도 값

예제:

서비스가 열 주소 및 홈 주소라는 용어에 대해 다음 신뢰도 값을 리턴한다고 가정합니다.

Class-based assignment: 0.4
ML-based assignment: 0.3

전체 신뢰도는 서비스가 리턴한 가장 높은 값이기 때문에 0.4입니다.

용어 지정 공개

강화 결과를 공개할 때, 수동 또는 자동이 아닌 용어 지정은 주어진 데이터 자산을 포함하는 모든 프로젝트 및 카탈로그에서 사용 가능합니다. 용어 제안은 공개되지 않습니다.

공개된 용어 지정을 제거하면 데이터 자산을 포함하는 모든 프로젝트가 영향을 받습니다. 강화 결과 내에서 작업하는 동안에는 변경사항이 프로젝트의 내부에 있습니다. 그러나 변경사항을 공개하면 해당 항목이 포함된 모든 프로젝트의 자산에서 해당 용어가 제거됩니다. 공개된 지정을 제거하기 전에 다른 사용자가 이를 목적으로 추가하지 않았는지 확인하십시오.

강화를 재실행할 때 새 분석 결과는 다음과 같이 용어 지정을 업데이트합니다.

  • 기존의 제안된 용어가 삭제되고 새 제안 용어로 대체됩니다.
  • 기존의 거부된 항, 수동 할당 및 자동 지정은 그대로 남아 있습니다.
  • 새 자동 지정이 추가됩니다.

자세히 보기

상위 주제: 메타데이터 강화 결과