영어 버전 문서로 돌아가기도수 분포 테이블
도수 분포 테이블
마지막 업데이트 날짜: 2024년 12월 13일
데이터 자산에 대해 고급 프로파일링을 실행할 때 소스 데이터를 기반으로 자산의 각 열에 있는 중복 제거 값에 대해 자세한 도수 분포가 판별됩니다.
고급 프로파일링 실행에 대한 설정을 구성할 때 도수 분포 정보의 전부 또는 일부를 데이터베이스 테이블에 쓰도록 선택할 수 있습니다. 고급 데이터 프로파일링을 참조하십시오. 이 테이블은 표준 데이터베이스 쿼리 또는 IBM Knowledge Catalog API를 사용하거나 자세한 열 프로필을 통해 액세스할 수 있습니다. 그러나 열 프로필에는 실제로 저장된 값의 수에 관계없이 처음 100개의 고유 값만 표시됩니다.
각 구별 값에 대해 테이블에는 다음 정보가 포함되어 있습니다.
컬럼 이름 | 설명 |
---|---|
AssetId | 프로젝트에 있는 데이터 자산의 ID입니다. |
ChangeDate | 정보가 업데이트된 날짜입니다. |
ColumnName | 데이터 자산의 열 이름입니다. |
DataClassification | 쉼표 (,) 로 구분된 데이터 자산의 열에 지정된 데이터 클래스의 ID 목록입니다. 열에 데이터 클래스가 지정되지 않으면 테이블에 U 가 표시됩니다. |
DistinctValue | 열의 실제 데이터 값입니다. 바이트 단위의 최대 길이는 유니코드의 경우 4096자 또는 2,048자입니다. 모든 값은 실제 데이터 유형에 관계없이 문자열로 저장됩니다. 따라서 세부 열 프로필에서 값을 정렬할 때 문자열 정렬 순서가 적용됩니다. |
FrequencyCount | 이 값이 발생하는 빈도입니다. |
GeneralFormat | 데이터 값의 문자 패턴을 나타내는 형식입니다. 모든 영문자는 문자의 대소문자에 따라 대문자 또는 소문자 A로 표시됩니다. 모든 숫자 문자는 숫자 9로 표시됩니다. 공백 및 특수 문자는 표시된 대로 표시됩니다. |
InferredDataType | 추론된 데이터 유형 (예: 정수, 문자열 또는 날짜) 입니다. |
ProjectId | 분석이 실행된 프로젝트의 ID입니다. |
PropertyLength | 문자열 필드의 길이입니다. |
PropertyPrecision | 숫자 필드의 총 길이입니다. |
PropertyScale | 숫자 값의 스케일은 숫자 필드의 10진수 컴포넌트에 대한 총 길이입니다. |
이러한 추가 컬럼은 내부용으로 예약되어 있으며 통지 없이 변경될 수 있습니다.
- 클래스
- ChangedByUser
- DataClassificationStatusFlag
- DomainPattern
- DomainValueFlag
- DomainValueFlagDate
- DomainValueFlaggedByUser
- FieldNumber
- FormatFlag
- FormatFlagDate
- FormatFlaggedByUser
- InvalidReasonCode
- ODBC 유형
- SourceOfDistinctValue
- TypeCode
- TypeOfDomainValue
자세한 정보
상위 주제: 메타데이터 강화 결과 검토