0 / 0

평가 차트

마지막 업데이트 날짜: 2025년 3월 26일
평가 차트
평가 차트는 히스토그램 또는 콜렉션 그래프와 비슷합니다. 평가 차트는 모델이 특정 결과를 예측하는 데 얼마나 정확한지 표시합니다. 예측 값 및 예측의 신뢰도를 기반으로 레코드를 정렬하고 레코드를 동일한 크기 (분위수) 의 그룹으로 분할한 후 각 분위수에 대한 기준 값을 가장 높은 값에서 가장 낮은 값으로 플로팅하여 작업합니다. 다중 모델이 도표에 선구분 변수로 표시됩니다.

결과는 특정 값 또는 값 범위를 "적중" 으로 정의하여 처리됩니다. 적중은 일반적으로 관심 있는 이벤트(예: 특정 의료 진단) 또는 일부 정렬(예: 고객에 대한 판매)의 성공을 표시합니다.

플래그
출력 필드는 간단합니다. 적중은 true 값에 해당합니다.
명목형
명목 출력 필드의 경우 세트의 첫 번째 값이 적중을 정의합니다.
연속형
연속 출력 필드의 경우 적중은 필드 범위의 중심점보다 큰 값과 동일합니다.

평가 차트는 각 점이 해당 분위수에 대한 값에 모든 상위 분위수를 더한 값과 동일하도록 누적될 수도 있습니다. 누적 차트가 일반적으로 모델의 전체 성능을 더 잘 전달하지만 비누적 차트가 모델에 대한 특정 문제점 영역 표시에서 뛰어날 수도 있습니다.

단순 평가 차트 작성

  1. 차트 유형 섹션에서 평가 아이콘을 클릭하십시오.

    캔버스가 업데이트되어 평가 차트 템플리트가 표시됩니다.

  2. 대상 필드, 예측 필드신뢰도 필드 변수를 설정하십시오. 목표 필드는 둘 이상의 값을 가진 명목 필드 또는 인스턴스화된 플래그일 수 있습니다. 예측 필드는 예측값으로 사용되는 변수를 정의합니다. 신뢰도 필드는 예측의 신뢰도를 설정하는 데 사용되는 변수를 정의합니다.
    참고: 예측 필드 변수 유형은 대상 필드에 대해 선택된 변수 유형과 일치해야 합니다.
  3. 사용자 정의 적중을 표시하는 데 사용하는 사용자 정의 조건을 지정하십시오. 이 옵션은 값의 순서 및 대상 필드의 유형에서 관심 있는 결과를 추론할 때보다 관심 있는 결과를 정의하는 경우에 유용합니다.

    적중 조건에 대해 CLEM 표현식을 지정해야 합니다. 예를 들어, @TARGET = "YES" 는 대상 필드에 대한 Yes 값이 평가에서 적중으로 계수됨을 표시하는 유효한 조건입니다. 지정된 조건이 모든 대상 필드에 사용됩니다.

  4. 프로젝트에 시각화 저장 제어를 클릭하십시오. 새 자산 작성 또는 기존 자산에 추가를 선택하십시오. 시각화 자산 이름, 선택적 설명 및 차트 이름을 제공하십시오.
  5. 적용 을 클릭하여 시각화를 프로젝트에 저장하십시오. 이제 자산 탭에서 새 시각화 자산을 사용할 수 있습니다.

옵션

대상 필드
두 개 이상의 값이 있는 인스턴스화된 플래그 또는 명목 필드 변수를 나열합니다.
사용자 정의 적중
적중 값을 지정하십시오. 적중은 관심있는 이벤트를 표시합니다 (예: 특정 의료 진단).
예측 필드
예측값으로 사용할 수 있는 변수를 나열합니다.
신뢰도 필드
예측의 신뢰도를 설정할 수 있는 변수를 나열합니다.
누적 플롯
사용으로 설정된 경우 누적 차트를 작성합니다. 누적 차트에 각 분위수 및 더 높은 분위수에 대해 값이 표시됩니다.
표시 모드
이 설정은 미리보기 모드 및 출력에 표시되는 차트를 제어합니다.
단일 모드
선택할 경우 모델 분류 조정 차트가 미리보기 모드와 출력에 표시되는 차트에만 있습니다.
표준 모드
선택할 경우 모델 분류 조정, 분리점, 행렬 막대, ROC, 이득, ROI 및 이익 차트가 미리보기 모드와 출력에 표시됩니다.
전체 모드
선택할 경우 모델 분류 조정, 분리점, 행렬 막대, ROC, 이득, ROI, 이익, GINI, 리프트 및 반응 차트가 미리보기 모드와 출력에 표시됩니다.
평가 차트
절사
절사 차트는 지정된 절사 값에 대해 선택된 변수의 예측 값 대 실제 값을 표시합니다.
행렬 막대
매트릭스 막대형 차트는 여러 변수 사이에 선형 상관이 있는지 여부를 판별하는 좋은 방법입니다.
ROC
ROC (Receiver Operating Characteristic) 는 개체가 두 개의 범주가 있는 하나의 변수에 대해 분류되는 분류 체계의 성능을 평가합니다.
이득
Gains는 각 분위수에서 발생하는 적중 총계의 비율로 정의됩니다. 이익은 (number of hits in quantile / total number of hits) × 100%으로 계산됩니다.
ROI
ROI(Return On Investment)는 수입 및 비용 정의를 포함한다는 점에서 이익과 비슷합니다. ROI는 분위수에 대한 비용과 이익을 비교합니다. ROI는 (profits for quantile / costs for quantile) × 100%로 계산됩니다.
이익
이익은 각 레코드의 수입에서 레코드의 비용을 뺀 값입니다. 분위수에 대한 이익은 분위수의 모든 레코드에 대한 이익의 합계입니다. 수입은 적중에만 적용되는 것으로 가정되지만 비용은 모든 레코드에 적용됩니다. 이익 및 비용은 고정이거나 데이터의 필드에 의해 정의될 수 있습니다. 이익은 (분위수의 레코드에 대한 수입의 합계 - 분위수의 레코드에 대한 비용의 합계)로 계산됩니다.
Kolmogorov-Smirnov
변수에 대해 관측된 누적 분포 함수를 지정된 이론적 분포 (정규, 균일, 지수 또는 포아송) 와 비교합니다.
GINI
GINI는 통계적 산포도를 측정하고 수입 또는 재산 분포를 나타냅니다. 불균등을 측정하는 데 가장 일반적으로 사용됩니다.
리프트
리프트는 적중인 각 분위수의 레코드 백분율을 훈련 데이터의 전체 적중 백분율과 비교합니다. (hits in quantile / records in quantile) / (total hits / total records)로 계산됩니다.
응답
응답은 분위수에서 적중인 레코드의 백분율입니다. 반응은 (hits in quantile / records in quantile) × 100%로 계산됩니다.
평가 차트 설정
다음 설정은 이익과 ROI 차트에만 적용됩니다.
비용
각 레코드와 연관된 고정 비용을 지정합니다.
매출
적중을 나타내는 각 레코드와 연관된 고정수입을 지정합니다.
가중치
데이터의 레코드가 둘 이상의 단위를 표시하는 경우 빈도 가중치를 사용하여 결과를 조정할 수 있습니다. 각 레코드와 연관된 고정 가중치를 지정하십시오.