0 / 0

데이터 품질 규칙에 대한 출력 설정 구성

마지막 업데이트 날짜: 2025년 4월 08일
데이터 품질 규칙에 대한 출력 설정 구성

통계 정보보다 더 많은 규칙 출력을 캡처하려면 외부 출력 위치 및 해당 위치에 기록할 콘텐츠를 구성하세요.

규칙 출력을 데이터베이스 테이블에 쓰도록 선택할 수 있습니다. 정의 기반 규칙의 바인딩이 외부에서 관리되는 경우 최대 4개의 DataStage 출력 링크를 만들 수 있는 옵션도 있습니다.

데이터베이스 테이블 또는 출력 링크를 생성합니다:

  1. 외부 출력 옵션을 활성화하고 섹션을 펼칩니다.

    프로젝트 설정에서 출력 테이블 구성을 설정한 경우, 해당 구성을 상속하도록 선택하여 출력 콘텐츠 구성으로 바로 이동할 수 있습니다. 상속된 구성은 현재로 표시됩니다.

  2. 프로젝트 설정에 구성된 표를 사용하지 않으려면 생성하려는 출력 유형을 선택합니다:

    • 출력을 새 데이터베이스 테이블 또는 기존 데이터베이스 테이블에 씁니다.

      연결을 선택하십시오. 선택한 연결에 따라 스키마를 선택하거나 카탈로그와 스키마를 선택합니다. 새 테이블의 경우 생성할 출력 테이블의 이름을 입력합니다. 그렇지 않으면 기존 테이블을 선택합니다. 이 경우 출력 콘텐츠 섹션이 이 표의 열로 채워지고 콘텐츠를 이러한 열에 매핑할 수 있습니다.

      규칙을 실행할 때 출력 테이블을 프로젝트에 데이터 자산으로 추가할지 여부를 선택할 수 있습니다.

      지원되는 데이터베이스 유형은 큐레이션 및 데이터 품질에 지원되는 커넥터를 참조하세요.

      새 테이블을 정의할 때 테이블 이름은 사용자 정의 이름, 동적으로 이름을 만들기 위한 매개변수, 사용자 정의 이름과 매개변수의 조합 또는 매개변수의 조합이 될 수 있습니다.

      사용자 정의 테이블 이름은 이 규칙을 따라야 합니다:

      • 이름의 첫 글자는 알파벳이어야 합니다.
      • 나머지 이름은 알파벳, 숫자 또는 밑줄로 구성할 수 있습니다.
      • 이름에 공백이 없어야 합니다.

      동적 이름 생성의 경우 이러한 매개 변수를 사용할 수 있습니다:

      • #execution_id#
      • #rule_id#
      • #rule_name#
      • #project_id#
      • #job_id#
      • #rule_id#
      • #job_run_id#
      • #rule_id#

      값이 변경되는 매개변수의 경우 새 테이블이 생성될 수 있습니다:

      • 각 규칙 실행에 대해 #job_run_id#
      • 데이터 품질 규칙 UI에서 또는 API 호출을 통해 규칙을 실행하는 경우 #execution_id# 의 경우

      또한 이러한 옵션을 선택할 수 있습니다:

      • 문제가 발견될 때만 테이블 만들기 이 옵션은 규칙이 출력 레코드를 생성하지 않는 경우 빈 테이블이 생성되는 것을 방지합니다. 그러나 해당 이름의 테이블이 이전 규칙 실행을 위해 생성되었기 때문에 이미 존재하는 경우 테이블은 변경되지 않은 상태로 유지됩니다.
      • 생성된 출력 테이블을 프로젝트 자산으로 가져오기 규칙 출력에 쉽게 액세스할 수 있도록 하려면 새 규칙 출력 테이블을 프로젝트에 데이터 자산으로 추가하세요. 데이터베이스 쿼리를 실행하는 대신 프로젝트의 자산 페이지 또는 규칙의 실행 기록에서 데이터 자산을 열어 데이터를 볼 수 있습니다. 이 옵션은 기본적으로 작동됩니다.

      또한 다음 설정을 구성합니다:

      • 출력 레코드 : 출력에 모든 레코드를 포함할지, 규칙 조건을 충족하지 않는 레코드만 포함할지(기본 설정), 규칙 조건을 충족하는 레코드만 포함할지 선택합니다.
      • 최대 예외 출력 레코드 수 입니다: 모든 레코드를 포함하거나 최대 개수를 설정할 수 있습니다.
      • 업데이트 방법 : 출력 테이블의 기존 콘텐츠에 새 출력 레코드를 추가할 수 있습니다. 최근 실행의 출력 결과만 유지하려면 기존 레코드를 덮어쓰기를 선택합니다. 업데이트 메서드인 추가의 경우 테이블 스키마를 변경할 수 없으므로 열 이름을 바꾸거나 추가 또는 삭제할 수 없습니다. 데이터 품질 규칙의 출력 내용을 변경하고 기존 출력 테이블에 쓰려면 업데이트 방법 덮어쓰기를 사용하여 출력 테이블의 열을 새로 정의된 출력 열로 바꾸어야 합니다.

    • 바인딩이 DataStage 플로우에서 관리되는 경우 출력 링크를 만들려면 DataStage 출력 링크를 선택합니다. 최대 4개의 출력 링크를 구성하세요. 모든 레코드, 규칙 조건을 충족하지 않는 레코드만, 규칙 조건을 충족하는 레코드만 또는 위반된 모든 규칙 조건 중 특정 링크로 라우팅할 출력을 선택합니다. 또한 링크당 기록할 최대 출력 레코드 수를 정의합니다. 출력 레코드의 콘텐츠는 다음 단계에서 구성하는 내용에 따라 결정됩니다. 위반된 규칙 조건의 경우 규칙의 데이터 품질 정의 수에 따라 0개 이상의 출력 레코드가 반환될 수 있습니다. 각 출력 레코드에는 다음과 같은 정보가 있습니다:

      • 레코드 ID입니다. 이 메트릭은 자동으로 출력 열로 설정됩니다.
      • 입력 레코드가 통과하지 못한 정의 중 하나의 정의 ID입니다
      • 중복된 정의의 경우 실패한 정의를 고유하게 식별하는 번호입니다

      정의 ID를 프로젝트의 데이터 품질 정의에 매핑하려면 IBM Knowledge Catalog API를 사용하세요:

      이러한 출력 링크의 대상 노드는 DataStage 플로우에서 구성해야 합니다.

    출력 유형은 언제든지 변경할 수 있습니다. 새 선택 항목에 따라 구성된 모든 설정이 재설정되거나 덮어쓰기됩니다. 완료했으면 섹션을 축소하고 출력 콘텐츠 구성을 진행합니다.

  3. 출력 테이블의 콘텐츠를 구성합니다.

    1. 바인딩이 외부에서 관리되는 경우 DataStage 입력 링크를 통해 제공되는 추가 열을 출력 테이블에 포함할 수 있습니다. 이러한 컬럼은 출력 테이블 구성에 나열되지 않습니다. 규칙 바인딩에 사용되는 변수는 포함할 수 없습니다.
    2. 출력 콘텐츠 추가를 클릭하고 다음 옵션 중 하나를 선택합니다:
      • Columns

        출력 테이블에서 보려는 열을 선택합니다. SQL 기반 규칙의 경우 SQL 쿼리가 반환하는 모든 열에서 선택할 수 있습니다. 외부에서 관리되는 바인딩을 사용하여 정의 기반 규칙을 만드는 경우에는 옵션을 사용할 수 없습니다.

      • 통계 및 속성

        출력 테이블에 포함할 추가 속성 또는 통계를 선택합니다. 사용 가능한 메트릭은 데이터 품질 규칙의 유형에 따라 다릅니다.

        • 자산 ID에 바인드됨

          규칙이 바인딩된 데이터 자산의 ID를 나열합니다. 이 메트릭을 선택하면 데이터 품질 규칙의 각 데이터 자산에 대해 하나의 출력 레코드가 작성됩니다. 따라서 개별 입력 레코드에 대해 두 개 이상의 출력 레코드가 작성될 수 있습니다. 동일한 데이터 품질 규칙의 다른 자산에 대한 출력 레코드의 콘텐츠는 각 개별 입력 레코드에 대한 이러한 메트릭에 대해서만 다릅니다: 데이터 품질 정의, 데이터 품질 정의 ID, 자산 ID에 바인딩됨, 합격 규칙, 불합격 규칙, 합격 규칙 비율불합격 규칙 비율

          이 메트릭은 데이터 품질 정의 또는 데이터 품질 정의 ID 메트릭과 함께만 사용할 수 있습니다. 규칙이 둘 이상의 데이터 품질 정의와 연결된 경우, 메트릭 모호성 제거기가 자동으로 출력에 포함됩니다.

          이 메트릭은 외부에서 관리되는 바인딩이 있는 정의 기반 규칙이나 SQL 기반 규칙에는 사용할 수 없습니다.

        • 열에 바인드됨

          바인딩된 각 열의 이름을 나열합니다. 이 메트릭을 선택하면 데이터 품질 정의의 각 열에 대해 하나의 출력 레코드가 작성됩니다. 따라서 개별 입력 레코드에 대해 두 개 이상의 출력 레코드가 작성될 수 있습니다. 동일한 데이터 품질 정의의 다른 열에 대한 출력 레코드의 콘텐츠는 각 개별 입력 레코드에 대한 이러한 메트릭에 대해서만 다릅니다: 데이터 품질 정의, 데이터 품질 정의 ID, 열에 바인딩됨, 합격 규칙, 불합격 규칙, 합격 규칙 비율불합격 규칙 비율

          이 메트릭은 데이터 품질 정의 또는 데이터 품질 정의 ID 메트릭과 함께만 사용할 수 있습니다. 규칙이 둘 이상의 데이터 품질 정의와 연결된 경우, 메트릭 모호성 제거기가 자동으로 출력에 포함됩니다.

          이 메트릭은 외부에서 관리되는 바인딩이 있는 정의 기반 규칙이나 SQL 기반 규칙에는 사용할 수 없습니다.

        • 데이터 품질 정의

          적용된 데이터 품질 정의의 이름을 나열합니다. 이 메트릭을 선택하면 규칙에 포함된 데이터 품질 정의의 수에 따라 여러 개의 출력 레코드가 기록될 수 있습니다.

          이 메트릭은 SQL 기반 규칙에는 사용할 수 없습니다.

        • 데이터 품질 정의 ID

          적용된 데이터 품질 정의를 식별하는 고유 키를 포함합니다. 이 메트릭을 선택하면 규칙에 포함된 데이터 품질 정의의 수에 따라 여러 개의 출력 레코드가 기록될 수 있습니다.

          이 메트릭은 SQL 기반 규칙에는 사용할 수 없습니다.

        • 모호성 제거기

          데이터 품질 정의가 여러 번 사용되는 경우 규칙에서 주로 사용되는 데이터 품질 정의를 모호하게 하기 위한 숫자를 포함합니다. 번호 매기기는 0부터 시작합니다.

          이 메트릭은 SQL 기반 규칙에는 사용할 수 없습니다.

        • 실패 규칙

          레코드가 충족하지 못한 규칙 조건의 수를 표시합니다.

        • 작업 ID

          규칙의 DataStage 흐름과 연결된 작업을 식별하는 고유 키를 포함합니다.

        • 작업 실행 ID

          규칙에 대한 DataStage 흐름과 연결된 작업의 개별 실행을 식별하는 고유 키를 포함합니다.

        • 패스 규칙

          레코드가 충족한 규칙 조건의 수를 표시합니다.

        • 패스 규칙 백분율

          충족된 규칙 조건의 비율을 표시합니다.

        • 실패 규칙 백분율

          충족되지 않은 규칙 조건의 비율을 표시합니다.

        • 프로젝트 ID

          규칙이 있는 프로젝트를 식별하는 고유 키를 포함합니다.

        • 레코드 ID

          출력에서 레코드를 식별하는 고유 키를 포함합니다. 이 메트릭은 위반된 규칙 조건에 대한 출력 링크에 자동으로 포함됩니다.

        • 규칙 ID

          데이터 품질 규칙을 식별하는 고유 키를 포함합니다.

        • 규칙 이름

          데이터 품질 규칙의 이름을 포함합니다.

        • 시스템 날짜

          규칙이 실행된 시스템 날짜를 표시합니다. 시스템 날짜는 서버에 설정된 표준 시간대의 날짜입니다.

        • 시스템 시간

          규칙이 실행된 시스템 날짜와 시간을 표시합니다. 시스템 날짜 및 시간은 서버에 설정된 표준 시간대의 날짜 및 시간입니다.

      • 변수

        출력 테이블에 포함할 규칙 로직에서 변수를 선택합니다.

      • 표현식

        출력 열의 콘텐츠를 정의하는 표현식을 추가합니다. 출력 콘텐츠 개요에서 이 열에 설명이 포함된 이름을 지정할 수 있습니다. 블록 요소를 사용하여 표현식을 구성할 수 있습니다. 필요에 따라 요소를 선택하고 결합합니다. 블록 요소 사용에 대한 자세한 내용은 데이터 품질 정의 관리하기를 참조하세요. 또는 자유 형식 편집기를 사용하여 표현식을 구성할 수도 있습니다. 규칙 논리 또는 규칙 출력에 대한 빌딩 블록을 참조하세요.

자세한 정보

상위 주제: 데이터 품질 규칙 관리