0 / 0
영어 버전 문서로 돌아가기
모델 평가 구성
마지막 업데이트 날짜: 2024년 10월 25일
모델 평가 구성

평가를 구성하여 모델 성능에 대한 인사이트를 생성할 수 있습니다.

다음 유형의 평가를 구성할 수 있습니다:

  • 품질
    모델이 레이블 지정된 테스트 데이터와 일치하는 올바른 결과를 얼마나 잘 예측하는지 평가합니다.
  • 공정성
    모델이 한 그룹에 대해 다른 그룹보다 유리한 결과를 제공하는 편향된 결과를 생성하는지 여부를 평가합니다.
  • 드리프트
    최근 트랜잭션을 학습 데이터와 비교하여 모델의 정확도와 데이터 일관성이 어떻게 변화하는지 평가합니다.
  • 드리프트 v2
    모델 출력의 변경사항, 예측의 정확성 및 입력 데이터의 분포를 평가합니다.
  • 모델 상태
    모델 배치가 트랜잭션을 얼마나 효율적으로 처리하는지 평가합니다.
  • 생성형 AI 품질
    foundation model 작업을 얼마나 잘 수행하는지 측정합니다

기존 머신 러닝 모델을 평가하는 경우, 사용자 지정 평가 및 메트릭를 생성하여 모델 성능에 대한 더욱 다양한 인사이트를 생성할 수도 있습니다.

각 평가는 모델 성능에 대한 통찰력을 얻기 위해 분석할 수 있는 메트릭을 생성합니다.

평가를 구성할 때 다음과 같은 기본 예약 간격에 따라 평가를 지속적으로 실행하도록 선택할 수 있습니다:

평가 온라인 구독 기본 일정 일괄 구독 기본 일정
품질 1시간 1주
공정성 1시간 1주
드리프트 3시간 1주
드리프트 v2 1일 해당사항 없음
설명가능성 1주 1주
모델 상태 1시간 해당사항 없음
생성형 AI 품질 1시간 해당사항 없음

상위 주제: Watson OpenScale을 사용하여 AI 모델 평가

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기