ibm-watsonx-gov Python SDK는 머신 러닝 모델과 생성적 AI 자산을 프로그래밍 방식으로 모니터링, 관리, 통제하는 데 사용할 수 있는 Python 라이브러리입니다. Python SDK를 사용하여 노트북 런타임 환경에서 메트릭스와 알고리즘을 계산하거나, 모델 평가를 위해 IBM Analytics Engine 에 대해 Spark 작업으로 오프로드할 수 있습니다.
ibm-watsonx-govPython SDK를 사용하여 평가 지표를 계산하고 통찰력을 생성하십시오. 모듈을 사용하여 이러한 작업을 자동화하고, 여러분의 애플리케이션과 통합할 수 있습니다. 샘플 노트북을 사용하여 측정 기준을 계산할 수도 있습니다.
모듈
Copy link to section
Python 의 SDK는 모델 평가 작업을 자동화하고 통찰력을 생성하는 데 도움이 되는 다음 모듈을 지원합니다
콘텐츠 유효성 검사 메트릭은 문자열 기반 함수를 사용하여 생성된 LLM 출력 텍스트를 분석하고 유효성을 검사합니다. 콘텐츠 유효성 검사 지표를 생성하려면 입력에 LLM에서 생성된 텍스트 목록이 포함되어야 합니다.
입력에 트랜잭션 레코드가 포함되어 있지 않은 경우 메트릭은 콘텐츠 유효성 검사 성공 비율을 측정하고 이 비율을 총 유효성 검사 수와 비교합니다. 입력에 트랜잭션 레코드가 포함된 경우 메트릭은 총 유효성 검사 수와 비교하여 콘텐츠 유효성 검사 성공 비율을 측정하고 지정된 record_id로 유효성 검사 결과를 계산합니다.