HAP 평가 지표
마지막 업데이트 날짜: 2025년 2월 21일
HAP 지표는 모델 입력 또는 출력 데이터에 증오, 학대, 욕설이 포함된 독성 콘텐츠가 있는지 측정합니다.
메트릭 세부사항Copy link to section
Copy link to section
HAP는 모델의 입력 또는 출력에 유해하거나 민감한 정보가 포함되어 있는지 여부를 식별하는 데 도움이 되는 데이터 안전성 지표입니다.
범위Copy link to section
Copy link to section
HAP(Hate, Abuse, or Profanity) 지표는 생성적 AI 자산만을 측정합니다.
- AI 자산의 유형 : 프롬프트 템플릿
- 생성적 AI 작업 :
- 텍스트 요약
- 컨텐츠 생성
- 질문 응답
- 검색 증강 생성(RAG)
- 지원 언어 : 영어
점수와 가치Copy link to section
Copy link to section
HAP 지표 점수는 생성된 결과물에서 유해 콘텐츠가 감지되었는지 여부를 나타냅니다. 점수가 높을수록 모델의 입력 또는 출력에 유해 콘텐츠의 비율이 더 높다는 것을 의미합니다.
- 값의 범위 : 0.0-1.0
- 최상의 점수 : 0.0
- 비율:
- 0시: 유해 콘텐츠가 감지되지 않음
- 0 이상: 유해 콘텐츠의 양이 증가하는 것으로 감지됨
설정Copy link to section
Copy link to section
- 임계치 :
- 상한: 0
상위 주제: 평가 지표
주제가 도움이 되었습니까?
0/1000