요청 실패 평가 지표

마지막 업데이트 날짜: 2025년 3월 07일
요청 실패 평가 지표

실패한 요청 지표는 총 질문 수 중 실패한 비율로 측정됩니다.

메트릭 세부사항

실패한 요청은 모델 답변의 품질을 측정하는 데 도움이 되는 생성적 AI 품질 평가의 답변 품질 지표입니다. 답변 품질 지표는 LLM-as-a-judge 모델로 계산됩니다. Watsonx.governance 미세 조정된 모델로 실패한 요청 지표를 계산하지 않습니다.

범위

실패한 요청 지표는 생성적 AI 자산만을 평가합니다.

  • AI 자산의 유형 : 프롬프트 템플릿
  • 생성적 AI 작업 :
    • 증강 검색 생성(RAG)
    • 질문 응답
  • 지원 언어 : 영어

점수와 가치

성공하지 못한 요청 지표 점수는 모델이 질문에 얼마나 성공적으로 답변을 제공하는지를 나타냅니다. 점수가 높을수록 해당 모델이 해당 질문에 대한 답을 제공할 수 없다는 것을 의미합니다.

  • 값의 범위 : 0.0-1.0
  • 최상의 점수 : 1.0

설정

  • 임계치 :
    • 하한: 0
    • 상한: 1

상위 주제: 평가 지표