설명 가능성을 구성하여 거래에 대한 모델의 예측 결과에 기여하는 기능을 표시하고 어떤 변경으로 인해 다른 결과가 발생할지 예측할 수 있습니다.
설명 가능성을 구성하여 모델 결과에 영향을 미치는 요인을 분석할 수 있습니다. 특정 모델 트랜잭션에 대한 요인의 영향을 분석하도록 로컬 설명을 구성하고 모델 결과에 영향을 주는 일반 요인을 분석하도록 글로벌 설명을 구성하도록 선택할 수 있습니다.
설명가능성을 수동으로 구성하거나 사용자 지정 노트북을 실행하여 설명가능성 아카이브를 생성할 수 있습니다.
노트북을 실행할 때 아카이브를 업로드하여 평가에 필요한 매개변수를 지정할 수 있습니다. 학습 데이터를 제공하지 않는 경우에는 설명 가능성을 구성하기 위해 아카이브를 생성해야 합니다.
설명 기능을 수동으로 구성하는 경우에는 생성할 설명 유형을 결정하는 매개변수를 설정해야 합니다. 제어 가능한 기능을 지정하고 언어 지원을 사용하도록 선택할 수도 있습니다.
매개변수 구성
매개변수를 구성하려면 사용할 설명 방법을 지정해야 합니다. 로컬 설명 방법으로 SHAP(샤플리 부가 설명) 또는 LIME(로컬 해석 가능한 모델-무작위 설명)을 사용하도록 선택해야 합니다. SHAP을 로컬 설명 방법으로 사용하는 경우 모델이 각 로컬 설명에 대해 생성하는 섭동의 수를 지정하고 배경 데이터 사용 옵션을 선택해야 합니다. 배경 데이터는 설명에 대한 결과에 대한 기능의 영향을 결정하는 데 사용됩니다. LIME을 로컬 설명으로 사용하는 경우, 퍼버레이션의 개수만 지정해야 합니다.
글로벌 설명 매개변수를 활성화하면 글로벌 설명 방법으로 SHAP(Shapley 부가 설명) 또는 LIME(로컬 해석 가능한 모델-무작위 설명)을 사용할 수도 있습니다. 글로벌 설명 방법을 구성하려면 진행 중인 설명을 생성하는 데 사용되는 모델 트랜잭션의 샘플 크기와 설명이 생성되는 시기를 결정하는 일정을 지정해야 합니다. 또한 글로벌 설명 안정성 임계값을 지정하고 기준 글로벌 설명이 생성되는 방식을 지정하는 옵션을 선택해야 합니다. 이러한 설정은 글로벌 설명 안정성 지표를 계산하는 데 사용됩니다.
제어 가능한 기능
제어 가능한 기능은 변경할 수 있으며 모델 결과에 상당한 영향을 미치는 기능입니다. 제어 가능한 기능을 지정하여 다른 결과를 초래할 수 있는 변경 사항을 식별할 수 있습니다.
언어 지원
언어 지원을 사용 설정하면 공백으로 구분되지 않은 언어를 분석하여 설명 가능성을 판단할 수 있습니다. 지원되는 언어를 자동으로 감지하도록 설명 기능을 구성하거나 분석할 지원 언어를 수동으로 지정할 수 있습니다. 구조화된 모델 및 이미지 모델에 대한 언어 지원을 구성할 수 없습니다.
지원되는 설명 가능성 지표
다음과 같은 설명 가능성 메트릭이 지원됩니다:
글로벌 설명 안정성
글로벌 설명 안정성은 시간에 따른 글로벌 설명의 일관성 정도를 나타냅니다
- 설명:
설명 가능성 평가를 구성할 때 제공하는 기준 데이터로 글로벌 설명이 생성됩니다. 글로벌 설명은 모델의 동작에 가장 큰 영향을 미치는 기능을 식별합니다. 새로운 글로벌 설명이 생성되면 각 설명을 기준 글로벌 설명과 비교하여 글로벌 설명의 안정성을 계산합니다. 글로벌 설명 안정성은 정규화된 할인 누적 이득(NDGC) 공식을 사용하여 새로운 글로벌 설명과 기준 글로벌 설명 간의 유사성을 결정합니다.
작동 방식: 값이 높을수록 기준 설명과의 일치도가 높음을 나타냅니다
- 0시: 설명이 매우 다릅니다.
- 1에서: 설명은 매우 유사합니다.
계산을 해보세요:
글로벌 설명 안정성을 계산하는 데는 다음 공식이 사용됩니다:
DCGₚ
nDCGₚ = _____________________
IDCGₚ
한계
- SHAP 글로벌 설명에 대한 설정을 구성할 때 다음과 같은 제한 사항이 있습니다:
- 설명을 구성하는 데 사용하는 샘플 크기는 특정 기간 동안 생성되는 설명의 수에 영향을 줄 수 있습니다. 큰 샘플 크기에 대해 여러 설명을 생성하려고 하면 트랜잭션 처리에 실패할 수 있습니다.
- 여러 구독에 대한 설명을 구성하는 경우 배포에 20개 이하의 기능이 포함되어 있는 경우 샘플 크기 및 섭동 수 설정의 기본값을 지정해야 합니다.
- 열 이름의 등호(=)는 데이터에서 지원되지 않습니다. 등호로 인해 오류가 발생할 수 있습니다.
- 승자 클래스 확률만 리턴하는 SPSS 다중 클래스 모델에 대해서는 설명가능성이 지원되지 않습니다.
자세히 알아보기
상위 주제: AI 모델 평가하기