0 / 0
영어 버전 문서로 돌아가기
평가 노드
마지막 업데이트 날짜: 2024년 11월 22일
평가 노드(SPSS Modeler)

평가 노드는 애플리케이션에 대해 최적 모델을 선택하기 위해 예측 모형을 평가하고 비교하는 쉬운 방법을 제공합니다. 평가 차트는 특정 결과 예측 시 모델이 작동하는 방식을 보여줍니다. 평가 차트는 예측의 신뢰도 및 예측값을 기반으로 레코드를 정렬하고 레코드를 동일한 크기의 그룹(분위수)으로 분할한 후 각 분위수에 대한 비즈니스 기준의 값을 내림차순으로 도표로 작성하여 작동합니다. 다중 모델이 도표에 선구분 변수로 표시됩니다.

결과는 특정 값 또는 값 범위를 적중으로 정의하여 처리됩니다. 적중은 일반적으로 관심 있는 이벤트(예: 특정 의료 진단) 또는 일부 정렬(예: 고객에 대한 판매)의 성공을 표시합니다. 노드 특성의 옵션 섹션에서 적중 기준을 정의하거나, 다음과 같이 기본 적중 기준을 사용할 수 있습니다.

  • 플래그 출력 필드는 직설적이어서 적중은 값에 해당합니다.
  • 명목 출력 필드의 경우 세트의 첫 번째 값이 적중을 정의합니다.
  • 연속형 출력 필드의 경우 적중은 필드 범위의 중심점보다 큰 값과 동일합니다.

여섯 가지 유형의 평가 차트가 있으며 각각의 차트는 다른 평가 기준을 강조합니다.

Gains 차트

Gains는 각 분위수에서 발생하는 적중 총계의 비율로 정의됩니다. 이익은 (number of hits in quantile / total number of hits) × 100%으로 계산됩니다.

그림 1. 기준선, 최적 예측선 및 비즈니스 규칙이 표시된 Gains 차트(누적)
기준선, 최적 예측선 및 비즈니스 규칙이 표시된 Gains 차트(누적)

리프트 차트

리프트는 적중인 각 분위수의 레코드 백분율을 훈련 데이터의 전체 적중 백분율과 비교합니다. (hits in quantile / records in quantile) / (total hits / total records)로 계산됩니다.

그림 2. 점 및 최적 예측선을 사용하는 리프트 도표(누적)
점 및 최적 예측선을 사용하는 리프트 도표(누적)

반응 차트

반응은 단순히 적중인 분위수의 레코드 백분율입니다. 반응은 (hits in quantile / records in quantile) × 100%로 계산됩니다.

그림 3. 최적 예측선을 사용하는 반응 차트(누적)
최적 예측선을 사용하는 반응 차트(누적)

이익 차트

이익은 각 레코드에 대한 수입에서 해당 레코드에 대한 비용을 뺀 값입니다. 분위수의 이익은 단순히 분위수의 전체 레코드 이익 합계입니다. 수입은 적중에만 적용되는 것으로 가정되지만 비용은 모든 레코드에 적용됩니다. 이익 및 비용은 고정이거나 데이터의 필드에 의해 정의될 수 있습니다. 이익은 (sum of revenue for records in quantile − sum of costs for records in quantile)으로 계산됩니다.

그림 4. 최적 예측선을 사용하는 이익 차트(누적)
최적 예측선을 사용하는 이익 차트(누적)

ROI 차트

ROI(Return On Investment)는 수입 및 비용 정의를 포함한다는 점에서 이익과 비슷합니다. ROI는 분위수에 대한 비용과 이익을 비교합니다. ROI는 (profits for quantile / costs for quantile) × 100%로 계산됩니다.

그림 5. 최적 예측선을 사용하는 ROI 차트(누적
최적 예측선을 사용하는 ROI 차트(누적

ROC 차트

ROC(Receiver Operator Characteristic)는 이분형 분류자와 함께만 사용할 수 있습니다. ROC는 분류자의 성능을 기반으로 분류자를 시각화하고 구성하고 선택하는 데 사용할 수 있습니다. ROC 차트는 분류자의 거짓 긍정 비율에 대해 참 긍정 비율(민감도)을 도표화합니다. ROC 차트는 이익(참 긍정)과 비용(거짓 긍정) 간 상대적인 균형을 보여줍니다. 참 긍정은 적중인 인스턴스이며 적중으로 분류됩니다. 따라서 참 긍정 비율은 참 긍정 수를 실제로 적중인 인스턴스 수로 나눠서 계산됩니다. 거짓 긍정은 빗나감인 인스턴스이며 적중으로 분류됩니다. 따라서 거짓 긍정 비율은 거짓 긍정 수를 실제로는 빗나감인 인스턴스 수로 나눠서 계산됩니다.

그림 6. 최적 예측선을 사용하는 ROC 차트
최적 예측선을 사용하는 ROC 차트

각각의 점이 해당 분위수에 대한 값에 더 높은 모든 분위수를 더한 값과 동일하도록 평가 차트는 누적일 수도 있습니다. 누적 차트가 일반적으로 모델의 전체 성능을 더 잘 전달하지만 비누적 차트가 모델에 대한 특정 문제점 영역 표시에서 뛰어날 수도 있습니다.

참고: 평가 노드는 필드 이름에서 쉼표 사용을 지원하지 않습니다. 필드 이름에 쉼표가 포함된 경우 쉼표를 제거하거나, 필드 이름을 따옴표로 묶어야 합니다.
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기