0 / 0
영어 버전 문서로 돌아가기
고급 데이터 프로파일링
마지막 업데이트 날짜: 2024년 9월 23일
고급 데이터 프로파일링

고급 프로파일링은 일반 프로파일링보다 더 정확한 결과를 제공하지만 대량의 데이터를 처리해야 하므로 작업을 완료하는 데 시간이 더 오래 걸립니다.

고급 프로파일링을 실행하려면 DataStage 서비스를 배치해야 합니다.

메타데이터 강화의 일부로 실행되는 모든 조작에는 보안 권한 부여를 위한 신임 정보가 필요합니다. 일반적으로 사용자 API키는 중단 없이 이러한 장기 실행 조작을 실행하는 데 사용됩니다. 고급 프로파일링을 실행하려고 할 때 신임 정보를 사용할 수 없는 경우 API키를 작성하도록 프롬프트가 표시됩니다. 그런 다음 해당 API키가 태스크 신임 정보로 저장됩니다. 사용자 API키 관리를 참조하십시오.

데이터 소스에 대한 연결이 잠겨 있으면 개인 신임 정보를 입력하도록 요청됩니다. 이는 연결을 영구적으로 잠금 해제하는 일회성 단계입니다.

하나 이상의 자산에서 고급 데이터 프로파일링을 실행하려면 다음을 수행하십시오.

  1. 메타데이터 강화 자산을 여십시오.

  2. 자산 탭에서 필요에 따라 자산을 선택하십시오.

  3. 도구 모음에서 강화 > 고급 데이터 프로파일링 실행 을 선택하십시오.

  4. 선택사항: 설정을 사용자 정의하십시오.

    • 도수 분포 정보를 데이터베이스 테이블에 기록할지 여부를 선택하고 캡처할 중복 제거 값 수를 판별하십시오.

      출력 테이블이 없으면 처음 100개의 구별 값이 내부적으로 캡처되고 저장됩니다. 컬럼 프로파일의 통계 페이지에서 해당 정보를 보고 다운로드할 수 있습니다.

      도수 분포 정보를 테이블에 쓰도록 선택하는 경우 외부 출력 옵션을 사용으로 설정하십시오. 이 섹션은 기본 인리치먼트 설정으로 미리 채워집니다. 고급 프로파일링 설정을 참조하십시오. 이 개별 고급 프로파일링 실행에 필요한 대로 설정을 변경할 수 있습니다. 출력 테이블을 변경하는 경우 이 테이블을 새 기본 위치로 설정하여 이전 기본 설정을 겹쳐쓸 수도 있습니다.

      표준 데이터베이스 쿼리를 사용하거나 자세한 열 프로필을 통해 이 테이블에 액세스할 수 있습니다. 자세한 정보는 도수 분포를 참조하십시오.

    • 샘플링 유형을 선택하십시오. 메타데이터 강화 자산 작성을 참조하십시오.

  5. 실행을 클릭하십시오. 분석이 완료되면 알림을 받습니다.

자세한 정보

상위 주제: 데이터 자산 강화

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기