평가 차트
마지막 업데이트 날짜: 2025년 3월 26일
평가 차트는 히스토그램 또는 콜렉션 그래프와 비슷합니다. 평가 차트는 모델이 특정 결과를 예측하는 데 얼마나 정확한지 표시합니다. 예측 값 및 예측의 신뢰도를 기반으로 레코드를 정렬하고 레코드를 동일한 크기 (분위수) 의 그룹으로 분할한 후 각 분위수에 대한 기준 값을 가장 높은 값에서 가장 낮은 값으로 플로팅하여 작업합니다. 다중 모델이 도표에 선구분 변수로 표시됩니다.
결과는 특정 값 또는 값 범위를 "적중" 으로 정의하여 처리됩니다. 적중은 일반적으로 관심 있는 이벤트(예: 특정 의료 진단) 또는 일부 정렬(예: 고객에 대한 판매)의 성공을 표시합니다.
- 플래그
- 출력 필드는 간단합니다. 적중은
true
값에 해당합니다. - 명목형
- 명목 출력 필드의 경우 세트의 첫 번째 값이 적중을 정의합니다.
- 연속형
- 연속 출력 필드의 경우 적중은 필드 범위의 중심점보다 큰 값과 동일합니다.
평가 차트는 각 점이 해당 분위수에 대한 값에 모든 상위 분위수를 더한 값과 동일하도록 누적될 수도 있습니다. 누적 차트가 일반적으로 모델의 전체 성능을 더 잘 전달하지만 비누적 차트가 모델에 대한 특정 문제점 영역 표시에서 뛰어날 수도 있습니다.
단순 평가 차트 작성
- 차트 유형 섹션에서 평가 아이콘을 클릭하십시오.
캔버스가 업데이트되어 평가 차트 템플리트가 표시됩니다.
- 대상 필드, 예측 필드 및 신뢰도 필드 변수를 설정하십시오. 목표 필드는 둘 이상의 값을 가진 명목 필드 또는
인스턴스화된 플래그일 수 있습니다. 예측 필드는 예측값으로 사용되는 변수를 정의합니다. 신뢰도 필드는 예측의 신뢰도를 설정하는 데 사용되는 변수를 정의합니다.참고: 예측 필드 변수 유형은 대상 필드에 대해 선택된 변수 유형과 일치해야 합니다.
- 사용자 정의 적중을 표시하는 데 사용하는
사용자 정의 조건을 지정하십시오. 이 옵션은 값의 순서 및 대상 필드의
유형에서 관심 있는 결과를 추론할 때보다 관심 있는 결과를 정의하는
경우에 유용합니다.
적중 조건에 대해 CLEM 표현식을 지정해야 합니다. 예를 들어,
@TARGET = "YES"
는 대상 필드에 대한Yes
값이 평가에서 적중으로 계수됨을 표시하는 유효한 조건입니다. 지정된 조건이 모든 대상 필드에 사용됩니다. - 프로젝트에 시각화 저장 제어를 클릭하십시오. 새 자산 작성 또는 기존 자산에 추가를 선택하십시오. 시각화 자산 이름, 선택적 설명 및 차트 이름을 제공하십시오.
- 적용 을 클릭하여 시각화를 프로젝트에 저장하십시오. 이제 자산 탭에서 새 시각화 자산을 사용할 수 있습니다.
옵션
- 대상 필드
- 두 개 이상의 값이 있는 인스턴스화된 플래그 또는 명목 필드 변수를 나열합니다.
- 사용자 정의 적중
- 적중 값을 지정하십시오. 적중은 관심있는 이벤트를 표시합니다 (예: 특정 의료 진단).
- 예측 필드
- 예측값으로 사용할 수 있는 변수를 나열합니다.
- 신뢰도 필드
- 예측의 신뢰도를 설정할 수 있는 변수를 나열합니다.
- 누적 플롯
- 사용으로 설정된 경우 누적 차트를 작성합니다. 누적 차트에 각 분위수 및 더 높은 분위수에 대해 값이 표시됩니다.
- 표시 모드
- 이 설정은 미리보기 모드 및 출력에 표시되는 차트를 제어합니다.
- 단일 모드
- 선택할 경우 모델 분류 조정 차트가 미리보기 모드와 출력에 표시되는 차트에만 있습니다.
- 표준 모드
- 선택할 경우 모델 분류 조정, 분리점, 행렬 막대, ROC, 이득, ROI 및 이익 차트가 미리보기 모드와 출력에 표시됩니다.
- 전체 모드
- 선택할 경우 모델 분류 조정, 분리점, 행렬 막대, ROC, 이득, ROI, 이익, GINI, 리프트 및 반응 차트가 미리보기 모드와 출력에 표시됩니다.
- 평가 차트
- 절사
- 절사 차트는 지정된 절사 값에 대해 선택된 변수의 예측 값 대 실제 값을 표시합니다.
- 행렬 막대
- 매트릭스 막대형 차트는 여러 변수 사이에 선형 상관이 있는지 여부를 판별하는 좋은 방법입니다.
- ROC
- ROC (Receiver Operating Characteristic) 는 개체가 두 개의 범주가 있는 하나의 변수에 대해 분류되는 분류 체계의 성능을 평가합니다.
- 이득
- Gains는 각 분위수에서 발생하는 적중 총계의 비율로 정의됩니다. 이익은
(number of hits in quantile / total number of hits) × 100%
으로 계산됩니다. - ROI
- ROI(Return On Investment)는 수입 및 비용 정의를 포함한다는 점에서 이익과 비슷합니다. ROI는 분위수에 대한 비용과 이익을 비교합니다. ROI는
(profits for quantile / costs for quantile) × 100%
로 계산됩니다. - 이익
- 이익은 각 레코드의 수입에서 레코드의 비용을 뺀 값입니다. 분위수에 대한 이익은 분위수의 모든 레코드에 대한 이익의 합계입니다. 수입은 적중에만 적용되는 것으로 가정되지만 비용은 모든 레코드에 적용됩니다. 이익 및 비용은 고정이거나 데이터의 필드에 의해 정의될 수 있습니다. 이익은 (분위수의 레코드에 대한 수입의 합계 - 분위수의 레코드에 대한 비용의 합계)로 계산됩니다.
- Kolmogorov-Smirnov
- 변수에 대해 관측된 누적 분포 함수를 지정된 이론적 분포 (정규, 균일, 지수 또는 포아송) 와 비교합니다.
- GINI
- GINI는 통계적 산포도를 측정하고 수입 또는 재산 분포를 나타냅니다. 불균등을 측정하는 데 가장 일반적으로 사용됩니다.
- 리프트
- 리프트는 적중인 각 분위수의 레코드 백분율을 훈련 데이터의 전체 적중 백분율과 비교합니다.
(hits in quantile / records in quantile) / (total hits / total records)
로 계산됩니다. - 응답
- 응답은 분위수에서 적중인 레코드의 백분율입니다. 반응은
(hits in quantile / records in quantile) × 100%
로 계산됩니다.
- 평가 차트 설정
- 다음 설정은 이익과 ROI 차트에만 적용됩니다.
- 비용
- 각 레코드와 연관된 고정 비용을 지정합니다.
- 매출
- 적중을 나타내는 각 레코드와 연관된 고정수입을 지정합니다.
- 가중치
- 데이터의 레코드가 둘 이상의 단위를 표시하는 경우 빈도 가중치를 사용하여 결과를 조정할 수 있습니다. 각 레코드와 연관된 고정 가중치를 지정하십시오.
주제가 도움이 되었습니까?
0/1000