키워드 포함 평가 지표

마지막 업데이트 날짜: 2025년 2월 26일
키워드 포함 평가 지표

키워드 포함 지표는 기초 모델 결과와 참조 또는 기준 사이의 명사와 대명사의 유사성을 측정합니다.

메트릭 세부사항

키워드 포함은 참조 또는 기준에 있는 특정 구문 또는 키워드와 일치하는 텍스트를 모델이 얼마나 잘 생성하는지를 측정하는 지표입니다. 이 측정 기준은 평가 측정 기준을 계산하기 위해 Python SDK를 사용할 때만 사용할 수 있습니다. 자세한 내용은 IBM watsonx.governance 에서 Computing Adversarial robustness and Prompt Leakage Risk 를 참조하십시오.

범위

키워드 포함 지표는 생성적 AI 자산만을 평가합니다.

  • AI 자산의 유형 : 프롬프트 템플릿
  • 생성적 AI 작업 :
    • 텍스트 요약
    • 질문 응답
    • 검색 증강 생성(RAG)
  • 지원 언어 : 영어

점수와 가치

키워드 포함 지표 점수는 생성된 결과물과 참조 또는 근거에 존재하는 키워드의 비율을 나타냅니다.

  • 값의 범위 : 0.0-1.0
  • 최상의 점수 : 1.0
  • 비율:
    • 0시에: 유사한 키워드가 출력에 포함되지 않습니다
    • 0 이상: 유사한 키워드의 수가 증가합니다.

상위 주제: 평가 지표