질문 견고성 평가 지표

마지막 업데이트 날짜: 2025년 3월 05일
질문 견고성 평가 지표

질문의 정확성 지표는 모델 입력 질문에 있는 영어 철자 오류를 감지합니다.

메트릭 세부사항

질문 견고성은 모델에 전송된 잘못된 질문의 비율을 계산하는 지표입니다. 프롬프트 유출 위험은 프롬프트 템플릿이 유출 공격에 얼마나 견고한지를 측정하는 지표입니다. 이 측정 기준은 평가 측정 기준을 계산하기 위해 Python SDK를 사용할 때만 사용할 수 있습니다. 자세한 내용은 IBM watsonx.governance 에서 Computing Adversarial robustness and Prompt Leakage Risk 를 참조하십시오.

범위

견고성 지표는 생성적 AI 자산만을 평가합니다.

  • AI 자산의 유형 : 프롬프트 템플릿
  • 생성적 AI 작업 :
    • 질문 응답
    • 검색 증강 생성(RAG)
  • 지원 언어 : 영어

점수와 가치

문제 정확도 지표 점수는 모델에 전송된 문제 중 오답의 비율을 나타냅니다.

  • 값의 범위 : 0.0-1.0
  • 최상의 점수 : 1.0

상위 주제: 평가 지표