0 / 0
영어 버전 문서로 돌아가기
도수 분포 테이블
마지막 업데이트 날짜: 2024년 12월 13일
도수 분포 테이블

데이터 자산에 대해 고급 프로파일링을 실행할 때 소스 데이터를 기반으로 자산의 각 열에 있는 중복 제거 값에 대해 자세한 도수 분포가 판별됩니다.

고급 프로파일링 실행에 대한 설정을 구성할 때 도수 분포 정보의 전부 또는 일부를 데이터베이스 테이블에 쓰도록 선택할 수 있습니다. 고급 데이터 프로파일링을 참조하십시오. 이 테이블은 표준 데이터베이스 쿼리 또는 IBM Knowledge Catalog API를 사용하거나 자세한 열 프로필을 통해 액세스할 수 있습니다. 그러나 열 프로필에는 실제로 저장된 값의 수에 관계없이 처음 100개의 고유 값만 표시됩니다.

각 구별 값에 대해 테이블에는 다음 정보가 포함되어 있습니다.

도수 분포 테이블
컬럼 이름 설명
AssetId 프로젝트에 있는 데이터 자산의 ID입니다.
ChangeDate 정보가 업데이트된 날짜입니다.
ColumnName 데이터 자산의 열 이름입니다.
DataClassification 쉼표 (,) 로 구분된 데이터 자산의 열에 지정된 데이터 클래스의 ID 목록입니다. 열에 데이터 클래스가 지정되지 않으면 테이블에 U가 표시됩니다.
DistinctValue 열의 실제 데이터 값입니다. 바이트 단위의 최대 길이는 유니코드의 경우 4096자 또는 2,048자입니다.
모든 값은 실제 데이터 유형에 관계없이 문자열로 저장됩니다. 따라서 세부 열 프로필에서 값을 정렬할 때 문자열 정렬 순서가 적용됩니다.
FrequencyCount 이 값이 발생하는 빈도입니다.
GeneralFormat 데이터 값의 문자 패턴을 나타내는 형식입니다. 모든 영문자는 문자의 대소문자에 따라 대문자 또는 소문자 A로 표시됩니다.
모든 숫자 문자는 숫자 9로 표시됩니다. 공백 및 특수 문자는 표시된 대로 표시됩니다.
InferredDataType 추론된 데이터 유형 (예: 정수, 문자열 또는 날짜) 입니다.
ProjectId 분석이 실행된 프로젝트의 ID입니다.
PropertyLength 문자열 필드의 길이입니다.
PropertyPrecision 숫자 필드의 총 길이입니다.
PropertyScale 숫자 값의 스케일은 숫자 필드의 10진수 컴포넌트에 대한 총 길이입니다.

이러한 추가 컬럼은 내부용으로 예약되어 있으며 통지 없이 변경될 수 있습니다.

  • 클래스
  • ChangedByUser
  • DataClassificationStatusFlag
  • DomainPattern
  • DomainValueFlag
  • DomainValueFlagDate
  • DomainValueFlaggedByUser
  • FieldNumber
  • FormatFlag
  • FormatFlagDate
  • FormatFlaggedByUser
  • InvalidReasonCode
  • ODBC 유형
  • SourceOfDistinctValue
  • TypeCode
  • TypeOfDomainValue

자세한 정보

상위 주제: 메타데이터 강화 결과 검토

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기