Data Refinery에서 데이터 유효성 검증

Data Refinery에 데이터를 추가한 후 언제든지 데이터의 유효성을 검증할 수 있습니다. 일반적으로 정제 프로세스의 여러 지점에서 이를 수행하려고 합니다.

데이터를 유효성 검증하려면 다음을 수행하십시오.

  1. Data Refinery에서 프로파일 탭을 클릭하십시오.

  2. 각 열에 대해 메트릭을 검토하십시오.

  3. 알아본 내용에 따라 다음 절에서 설명된 대로 적절한 조치를 수행하십시오.

빈도

빈도는 값 또는 일정 범위의 값이 발생하는 횟수입니다. 각 도수 분포(막대)는 열에서 고유한 값의 개수를 표시합니다.

도구 분포를 검토하여 데이터에서 이상 항목을 찾으십시오. 해당 이상 항목 데이터를 정리하려면 간단하게 해당 값을 제거하십시오.

정수 및 날짜/시간 열의 경우 보려는 바이너리(그룹화)의 수를 사용할 정의할 수 있습니다. 기본 다중 열 뷰에서 최대값은 20입니다. 빈도 차트 행을 펼치는 경우 최대값은 50입니다.

통계

통계는 정량적 데이터의 콜렉션입니다. 각 열의 통계는 해당 열에서 최소, 최대, 평균 및 고유한 값 수를 표시합니다.

열의 데이터 유형에 따라 각 열의 통계는 약간 다릅니다. 예를 들어 데이터 유형 문자열 열에 대한 통계에는 최소 길이, 최대 길이 및 평균 길이 값이 있는 반면, 데이터 유형 정수 열에 대한 통계에는 최소값, 최대값 및 평균 값이 있습니다.

상위 주제: 데이터 정제