요청 실패 평가 지표
마지막 업데이트 날짜: 2025년 3월 07일
실패한 요청 지표는 총 질문 수 중 실패한 비율로 측정됩니다.
메트릭 세부사항Copy link to section
Copy link to section
실패한 요청은 모델 답변의 품질을 측정하는 데 도움이 되는 생성적 AI 품질 평가의 답변 품질 지표입니다. 답변 품질 지표는 LLM-as-a-judge 모델로 계산됩니다. Watsonx.governance 미세 조정된 모델로 실패한 요청 지표를 계산하지 않습니다.
범위Copy link to section
Copy link to section
실패한 요청 지표는 생성적 AI 자산만을 평가합니다.
- AI 자산의 유형 : 프롬프트 템플릿
- 생성적 AI 작업 :
- 증강 검색 생성(RAG)
- 질문 응답
- 지원 언어 : 영어
점수와 가치Copy link to section
Copy link to section
성공하지 못한 요청 지표 점수는 모델이 질문에 얼마나 성공적으로 답변을 제공하는지를 나타냅니다. 점수가 높을수록 해당 모델이 해당 질문에 대한 답을 제공할 수 없다는 것을 의미합니다.
- 값의 범위 : 0.0-1.0
- 최상의 점수 : 1.0
설정Copy link to section
Copy link to section
- 임계치 :
- 하한: 0
- 상한: 1
상위 주제: 평가 지표
주제가 도움이 되었습니까?
0/1000