0 / 0
영어 버전 문서로 돌아가기
영역에서 배치 평가
마지막 업데이트 날짜: 2024년 7월 29일
영역에서 배치 평가

배치 영역에서 watsonx.governance 평가를 구성하여 모델 성능에 대한 인사이트를 얻으십시오. 평가를 구성할 때 평가 결과를 분석하고 공간에서 직접 트랜잭션 레코드를 모델링할 수 있습니다.

watsonx.governance 는 모델 배치를 평가하여 성능을 측정하고 모델 예측을 이해하는 데 도움을 줍니다. 모델 평가를 구성할 때 watsonx.governance 는 사용자가 검토할 수 있는 서로 다른 통찰을 제공하는 각 평가에 대한 메트릭을 생성합니다. watsonx.governance 는 또한 모델 예측이 판별되는 방법을 이해하는 데 도움이 되도록 평가 중에 처리되는 트랜잭션을 로그합니다. 자세한 정보는 Watson OpenScale로 AI 모델 평가를 참조하십시오.

프로비저닝된 watsonx.governance 인스턴스가 있는 경우 온라인 배치를 매끄럽게 작성한 후 배치 결과에서 공정성, 품질, 드리프트 및 설명 가능성을 모니터할 수 있습니다.

영역에서 모델 배치 평가

일반적인 시나리오는 다음 순서를 따릅니다.

  1. 배치 영역을 작성하고 watsonx.governance 인스턴스를 영역과 연관시켜 모든 모니터링 기능을 사용으로 설정하십시오. 요구사항에 따라 공간 유형 (예: 프로덕션 또는 사전 프로덕션) 을 선택할 수 있습니다.
  2. 훈련된 기계 학습 모델 및 입력 (페이로드) 데이터를 배치 영역으로 승격하고 모델에 대한 온라인 배치를 작성하십시오.
  3. 배치 테스트 탭에서 입력 데이터를 제공하고 예측을 다시 가져오십시오.
  4. 평가 탭에서 품질, 공정성 및 설명 가능성에 대해 배치를 모니터하도록 평가를 구성하십시오. Watson OpenScale 이 모델, 훈련 및 페이로드 데이터, 평가 결과를 저장하기 위한 저장소에 연결할 수 있도록 모든 필수 모델 세부사항을 제공하십시오.
  5. 모델이 편향되지 않은 결과를 생성하도록 공정성에 대한 모니터를 구성하십시오. 공정성을 모니터할 필드를 선택한 후 참조 그룹과 비교하여 모니터된 그룹에 대한 예측을 측정하기 위한 임계값을 설정하십시오. 예를 들어, 모델을 평가하여 성별에 따라 편향되지 않은 예측을 제공하는지 확인할 수 있습니다.
  6. 피드백 데이터라고 하는 레이블 지정된 테스트 데이터를 기반으로 모델이 생성하는 올바른 결과 수를 기반으로 모델 성능을 판별하도록 품질에 대한 모니터를 구성하십시오. 메트릭 값이 허용 가능한 범위를 벗어날 때 추적할 품질 임계값을 설정하십시오.
  7. 배치가 최신 상태이고 일관되도록 드리프트에 대한 모니터를 구성하십시오. 기능 중요도를 사용하여 모델에서 기능 드리프트의 영향을 판별하십시오. 예를 들어, 중요한 기능에서 작은 양의 드리프트는 덜 중요한 기능에서 적당한 양의 드리프트보다 모델에 더 큰 영향을 줄 수 있습니다.
  8. 설명 가능성에 대한 배치 결과를 모니터하여 모델이 예측을 판별하도록 한 요인을 이해할 수 있습니다. 사용자의 요구에 가장 적합한 설명 방법을 선택하십시오. 예를 들어, 자세한 설명을 위해 SHAP (Shapley Additive EXplanations) 메소드를 선택하거나 더 빠른 설명을 위해 LIME (Local Interpretable Model-Agnostic 설명) 메소드를 선택할 수 있습니다.
  9. 마지막으로 모델 평가를 검사하여 소수의 입력에 대한 작은 변경사항으로 인해 다른 의사결정이 발생하는 영역을 찾을 수 있습니다. 입력 변경이 모델 성능을 향상시킬 수 있는지 여부를 판별하기 위한 테스트 시나리오입니다.

다음 절에서는 watsonx.governance 평가를 구성하고 배치 영역에서 모델 인사이트를 검토하는 방법을 설명합니다.

공간에서 모델 평가 준비

watsonx.governance 인스턴스와 연관된 데이터베이스가 없는 경우 평가를 실행하기 전에 데이터베이스를 연관시켜야 합니다. 데이터베이스를 연관시키려면 필요한 데이터베이스 대화 상자에서 데이터베이스 연관 을 클릭하여 데이터베이스에 연결해야 합니다. 데이터베이스를 연관시키려면 프로젝트 및 watsonx.governance 인스턴스에 대한 Admin 역할이 지정되어야 합니다.

watsonx.governance 데이터베이스를 프로젝트와 연관

공간에서 Watson OpenScale 평가 구성

Watson OpenScale 인스턴스를 연관시킨 후 배치를 선택하여 평가를 구성하고 모델 인사이트를 검토하는 데 사용할 수 있는 평가트랜잭션 탭을 볼 수 있습니다. 공간에서 모델 평가 구성을 시작하기 위해 OpenScale 평가 설정 구성 을 선택하여 안내된 일련의 단계를 제공하는 마법사를 열 수 있습니다.

평가 탭에는 평가 구성을 시작하는 단추가 표시됩니다.

배치 영역에서만 온라인 배치를 평가할 수 있습니다.

모델 세부사항 제공

모델 평가를 구성하려면 watsonx.governance 가 모델 설정 방법을 이해할 수 있도록 모델 세부사항을 제공해야 합니다. 훈련 데이터 및 모델 출력에 대한 세부사항을 제공해야 합니다.

평가 설정을 구성하기 위한 모델 세부사항 제공

자세한 정보는 모델 세부사항 제공을 참조하십시오.

설명 가능성 구성

watsonx.governance 에서 설명 가능성을 구성하여 트랜잭션에 대해 모델이 예측하는 결과에 기여하는 기능을 표시하고 다른 결과를 초래하는 변경사항을 예측할 수 있습니다. 특정 모델 트랜잭션에 대한 요인의 영향을 분석하도록 로컬 설명을 구성하고 모델 결과에 영향을 주는 일반 요인을 분석하도록 글로벌 설명을 구성하도록 선택할 수 있습니다.

설명 가능성 설정 구성

자세한 정보는 설명 가능성 구성을 참조하십시오.

공정성 평가 구성

모델이 다른 그룹에 대해 편향된 결과를 생성하는지 여부를 판별하기 위해 공정성 평가를 구성할 수 있습니다. 공정성 평가를 구성하기 위해 선호 결과를 나타낼 것으로 예상되는 참조 그룹 및 사용할 공정성 메트릭을 지정할 수 있습니다. 또한 참조 그룹과 비교되는 기능을 선택하여 편향에 대해 평가할 수도 있습니다.

공정성 평가 구성

자세한 정보는 공정성 평가 구성을 참조하십시오.

품질 평가 구성

품질 평가를 구성하여 모델이 정확한 결과를 얼마나 잘 예측하는지 이해할 수 있습니다. 품질 평가를 구성하려면 watsonx.governance 가 모델 품질이 저하되는 시기를 식별할 수 있도록 각 메트릭에 대한 임계값을 지정해야 합니다.

품질 평가 구성

자세한 정보는 품질 평가 구성을 참조하십시오.

드리프트 v2 평가 구성

모델에 대한 일관된 결과를 얻을 수 있도록 드리프트 v2 평가를 구성하여 시간 경과에 따른 데이터의 변경사항을 측정할 수 있습니다. 드리프트 v2 평가를 구성하려면 watsonx.governance 가 모델 출력의 변경사항, 예측의 정확성 및 입력 데이터의 분포를 식별할 수 있도록 하는 임계값을 설정해야 합니다. 또한 watsonx.governance 가 값 분배의 변경을 측정할 수 있도록 중요한 기능을 선택해야 합니다.

driftv2 평가 구성

자세한 정보는 드리프트 v2 평가 구성을 참조하십시오.

드리프트 평가 구성

watsonx.governance 가 모델에서 정확성 및 데이터 일관성의 저하를 발견할 수 있도록 드리프트 평가를 구성할 수 있습니다. 드리프트 평가를 구성하려면 watsonx.governance 가 모델에 대한 정확성 및 일관성 기준선을 설정할 수 있도록 임계값을 설정해야 합니다.

드리프트 평가 구성

자세한 정보는 드리프트 평가 구성을 참조하십시오.

평가 실행

평가를 구성한 후 마법사를 닫아 평가를 실행할 수 있습니다. 평가를 실행하려면 평가 탭의 조치 메뉴에서 지금 평가 를 선택하여 모델 트랜잭션을 전송해야 합니다.

평가를 실행할 데이터 가져오기

평가 결과 검토

평가 탭에서 평가 결과를 분석하여 모델 성과에 대한 통찰력을 얻을 수 있습니다. 평가 결과를 분석하려면 평가 섹션에서 화살표 탐색 화살표 를 클릭하거나 조치 메뉴를 사용하여 모델에 대한 세부사항을 볼 수 있습니다.

모델이 설정된 임계값을 충족하는 방법에 대한 세부사항을 표시하는 각 평가와 함께 모델 배치 평가 차트가 표시됩니다.

자세한 정보는 평가 결과 검토를 참조하십시오.

모델 트랜잭션 검토

트랜잭션 탭에서 모델 트랜잭션을 분석하여 모델이 결과를 예측하는 방법을 이해하고 다른 결과를 초래할 수 있는 변경사항을 예측할 수 있습니다. 트랜잭션을 분석하기 위해 모델 예측 판별 방법에 대한 세부사항을 제공하는 설명을 보도록 선택할 수 있습니다.

트랜잭션 세부사항

자세한 정보는 모델 트랜잭션 설명을 참조하십시오.

상위 주제: 예측 배치 관리

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기