0 / 0
영어 버전 문서로 돌아가기
모델 평가를 위한 Python 클라이언트 샘플
마지막 업데이트 날짜: 2024년 11월 21일
모델 평가를 위한 Python 클라이언트 샘플

모델 평가에 Python 클라이언트 라이브러리를 사용하는 샘플 Jupyter 노트북을 검토하고 사용하여 기능 및 작업을 시연하세요.

샘플 노트북을 사용하여 Python 클라이언트의 기능과 작업을 시연할 때는 Jupyter Notebook 코딩하는 데 익숙해야 합니다. Jupyter 노트북은 대화식 컴퓨팅을 위한 웹 기반 환경입니다. 데이터를 처리하는 작은 코드 조각을 실행한 후 계산 결과를 즉시 볼 수 있습니다. 샘플 Jupyter 노트북을 사용하여 모델 구축, 교육 및 배포, 모델 평가 구성과 같은 작업을 시연하는 튜토리얼을 완료할 수 있습니다.

샘플 노트북

다음 Jupyter 노트북을 보거나 실행하여 다른 태스크를 완료하는 방법을 학습하십시오.

샘플 이름 설명된 태스크
IBM watsonx.governance 메트릭 툴킷을 사용하여 프롬프트 템플릿의 품질 평가 신속한 템플릿 평가를 위해 콘텐츠 분석 및 질문 견고성 지표를 계산하세요.
RAG 작업에 대해 IBM에서 LLM을 판독기로 사용하여 검색 및 답변 품질 지표 계산 RAG 및 답변 품질 메트릭을 계산하여 RAG 작업에 대한 답변을 생성합니다.
IBM watsonx.governance을 사용하여 적대적 견고성 및 즉각적인 유출 위험 계산하기 프롬프트 인젝션, 탈옥, 시스템 프롬프트 유출 등의 공격에 대해 모델이 어떻게 방어하는지 측정하기 위해 적대적 견고성 지표를 계산합니다.
LLM용 임베딩 생성 채점된 데이터의 CSV 파일을 사용하여 입력 및 출력 열에 대한 임베딩을 생성하고 임베딩이 포함된 모델 출력이 있는 CSV 파일을 다운로드합니다.
LLM을 위한 임베딩 생성 및 지속성 페이로드 테이블의 기존 레코드에 대한 임베딩을 생성하거나, 새로운 점수 데이터 프레임을 제공하여 페이로드 테이블에 임베딩이 포함된 레코드를 생성 및 저장하거나, 드리프트 v2 평가를 구성 및 평가할 수 있습니다.
IBM WatsonX.거버넌스를 위한 생성적 AI 품질 메트릭의 다국어 지원을 위한 설계 시간 노트북 생성형 AI 품질 프롬프트 템플릿 평가 결과를 일본어로 시연합니다.

다음 단계

  • 노트북 편집기 사용에 대해 자세히 학습하려면 노트북을 참조하십시오.
  • 노트북 관련 작업에 대해 자세히 알아보려면 노트북 코딩 및 실행을 참조하십시오.
  • 노트북에서 인증하는 방법에 대해 자세히 알아보려면 인증하기를 참조하세요.
일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기