빠른 시작: 기계 학습 모델 평가 | IBM Cloud Pak for Data as a Service

기계 번역된 주제 영어 버전으로 전환할 수 있음

본 문서의 가장 정확하고 최신 버전은 영어(원본) 버전을 참조하십시오. IBM은 자동으로 기계 번역된 컨텐츠를 사용하여 발생하는 피해 또는 손실에 대해 책임을 지지 않습니다.

영어 버전 문서로 돌아가기

빠른 시작: 기계 학습 모델 평가

모기지 자격이 있는 신청자를 예측하는 모델을 평가하는 방법을 학습하려면 이 학습서를 사용하십시오. 품질, 공정성 및 설명 가능성에 대해 모델을 평가해야 합니다.

필수 서비스: Watson Machine Learning; Watson Studio; Watson OpenScale

기본 워크플로우에는 다음 태스크가 포함됩니다.

프로젝트를 여십시오. 프로젝트는 데이터 및 모델에 대해 작업하기 위해 다른 사용자와 협업할 수 있는 위치입니다.
모델을 빌드합니다. 다음 방법 중 하나를 사용하여 모델을 빌드할 수 있습니다.
- Jupyter 노트북을 만들고 Python 코드를 추가합니다.
- AutoAI 실험을 작성하십시오.
모델을 배치하십시오.
다음 방법 중 하나를 사용하여 Watson OpenScale 모니터를 구성하십시오.
- Jupyter 노트북을 만듭니다.
- UI를 사용하여 Watson OpenScale 대시보드에 배치를 추가하십시오.

Watson OpenScale 에 대해 읽어보십시오.

Watson OpenScale 은 AI 모델의 결과를 추적하고 측정하며, 모델이 빌드되거나 실행 중인 위치에 관계없이 공정하고 설명 가능하며 규정을 준수하는지 확인하는 데 도움을 줍니다. Watson OpenScale은 또한 AI 모델이 프로덕션 중일 때 정확도에서 드리프트를 감지하고 수정하는 데 도움을 줍니다.

Watson OpenScale자세히 보기

기계 학습 모델 평가에 대한 비디오 보기

비디오 시청 비디오를 시청하면 이 학습서의 단계를 미리 볼 수 있습니다. 비디오에 표시된 사용자 인터페이스에 약간의 차이가 있을 수 있습니다. 이 비디오는 작성된 학습서와 함께 사용하기 위한 것입니다.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

기계 학습 모델 평가에 대한 학습을 시도해 보십시오.

이 학습서에서는 다음 태스크를 완료합니다.

태스크 1: 샘플 프로젝트 작성
태스크 2: 모델 배치
태스크 3: 노트북을 실행하여 모니터 설정
태스크 4: 모델 평가
태스크 5: 품질에 대한 모델 모니터 관찰
태스크 6: 공정성을 위해 모델 모니터 관찰
태스크 7: 드리프트에 대한 모델 모니터 관찰
태스크 8: 설명 가능성에 대한 모델 모니터 관찰

이 학습을 완료하기 위한 팁

다음은 이 학습서를 성공적으로 완료하기 위한 몇 가지 팁입니다.

비디오 사진 사용

팁: 비디오를 시작한 후 학습서를 스크롤하면 비디오가 그림 모드로 이동합니다. 픽처 인 픽처를 사용하여 최상의 경험을 얻으려면 비디오 목차를 닫으십시오. 그림 모드를 사용하여 이 학습서의 태스크를 완료할 때 비디오를 따라갈 수 있습니다. 수행할 각 태스크의 시간소인을 클릭하십시오.

다음 애니메이션 이미지는 비디오 픽처 인 픽처 및 목차 기능을 사용하는 방법을 보여줍니다.

그림 및 장을 사용하는 방법

커뮤니티에서 도움 받기

이 튜토리얼에 대한 도움이 필요한 경우 Cloud Pak for Data 커뮤니티 토론 포럼에서 질문하거나 응답을 찾을 수 있습니다.

브라우저 창 설정

이 튜토리얼을 완료하는 최적의 경험을 위해 한 브라우저 창에서 Cloud Pak for Data 를 열고 두 애플리케이션 간에 쉽게 전환할 수 있도록 다른 브라우저 창에서 이 튜토리얼 페이지를 열어 두십시오. 따라하기 쉽도록 두 개의 브라우저 창을 나란히 배열하는 것을 고려하십시오.

병행 학습서 및 UI

팁: 사용자 인터페이스에서 이 학습서를 완료하는 동안 안내식 둘러보기가 표시되면 나중에를 클릭하십시오.

태스크 1: 샘플 프로젝트 작성

학습서 비디오 미리보기 이 태스크를 미리보려면 00:06에 시작하는 비디오를 보십시오.

이 학습서에서는 기계 학습 모델 및 노트북을 포함하는 샘플 프로젝트를 사용하여 모니터를 구성합니다. 샘플을 기반으로 프로젝트를 작성하려면 다음 단계를 수행하십시오.

자원 허브에서 ML 모델 샘플 프로젝트 평가 에 액세스하십시오.
프로젝트 작성을 클릭하십시오.
프로젝트를 Cloud Object Storage 인스턴스에 연관시키도록 프롬프트가 표시되면 목록에서 Cloud Object Storage 인스턴스를 선택하십시오.
작성을 클릭하십시오.
프로젝트 가져오기가 완료될 때까지 기다린 후 새 프로젝트 보기 를 클릭하여 프로젝트 및 자산이 성공적으로 작성되었는지 확인하십시오.
자산 탭을 클릭하여 샘플 프로젝트의 자산을 보십시오.

진행 상태 확인

다음 이미지는 샘플 프로젝트를 표시합니다. 이제 학습서를 시작할 준비가 되었습니다.

태스크 2: 모델 배치

모델을 배치하기 전에 모델을 새 배치 영역으로 승격해야 합니다. 배치 영역은 입력 데이터 및 환경과 같은 지원 자원을 구성하고, 예측 또는 솔루션을 생성하기 위해 모델 또는 기능을 배치하고, 배치 세부사항을 보거나 편집하는 데 도움을 줍니다.

태스크 2a: 모델을 배치 영역으로 승격

학습서 비디오 미리보기 이 태스크를 미리보려면 00:49에서 시작하는 비디오를 보십시오.

모델을 새 배치 영역으로 승격하려면 다음 단계를 수행하십시오.

자산 탭에서 모기지 승인 예측 모델 을 클릭하여 모델을 보십시오.
모델 페이지에서 배치 영역으로 승격 아이콘 을 클릭하십시오.
대상 공간의 경우 새 배치 공간 작성을 선택하십시오.
1. 배포 공간 이름의 경우 선행 또는 후행 공백 없이 표시된 대로 이름을 복사하여 붙여넣습니다: Golden Bank Preproduction Space
2. 목록에서 스토리지 서비스를 선택하십시오.
3. 목록에서 프로비저닝된 기계 학습 서비스를 선택하십시오.
4. 작성을 클릭하십시오.
5. 닫기를 클릭하십시오.
대상 공간의 경우, 골든 뱅크 제조 공간이 선택되었는지 확인하십시오.
이를 프로모션한 후에는 공간의 모델로 이동 옵션을 확인하십시오.
승격을 클릭하십시오.

진행 상황 확인

다음 이미지는 배치 영역의 모델을 표시합니다. 이제 모델 배치를 작성할 준비가 되었습니다.

태스크 2b: 모델에 대한 온라인 배치 작성

학습서 비디오 미리보기 이 태스크를 미리 보려면 01:30에서 시작하는 비디오를 시청하십시오.

다음 단계에 따라 모델에 대한 온라인 배치를 작성하십시오.

배치 공간이 열리면 새 배치를 클릭하십시오.
1. 배치 유형의 경우 온라인을 선택하십시오.
2. 이름의 경우 배포 이름을 앞뒤 공백 없이 표시된 대로 정확하게 복사하여 붙여넣습니다: Mortgage Approval Model Deployment
3. 작성을 클릭하십시오.
모델 배치가 완료될 때까지 기다리십시오. 모델이 성공적으로 배치되면 배치를 보고 스코어링 엔드포인트를 확인하고 선택적으로 모델을 테스트하십시오.

진행 상황 확인

다음 이미지는 모델 배치를 표시합니다. 이제 노트북을 실행하여 모니터를 구성할 준비가 되었습니다.

태스크 3: 노트북을 실행하여 모니터 설정

학습서 비디오 미리보기 이 작업을 미리 보려면 01:55부터 시작하는 동영상을 시청하세요.

샘플 프로젝트에 포함된 노트북을 실행하여 다음을 수행합니다:

모델 및 배치를 페치하십시오.
Watson OpenScale을 구성하십시오.
기계 학습 서비스에 대한 서비스 제공자 및 등록을 작성하십시오.
품질 모니터를 구성하십시오.
공정성 모니터를 구성하십시오.
설명 가능성을 구성하십시오.

다음 단계에 따라 샘플 프로젝트에 포함된 노트북을 실행하십시오. 이 노트북은 사용자 인터페이스를 통해 구성할 수도 있는 모델에 대한 모니터를 설정합니다. 그러나 노트북을 사용하여 설정하는 것이 더 빠르고 오류가 적습니다. 각 셀의 코드를 설명하는 노트북의 주석을 읽어 보십시오.

탐색 메뉴 에서 프로젝트 > 모든 프로젝트 보기를 선택합니다.
ML 모델 평가 프로젝트를 여십시오.
자산 탭을 클릭한 다음 노트북으로 이동합니다.
monitor-wml-model-with-watson-openscale 노트북을 여십시오.
노트북이 읽기 전용 모드이므로 편집 아이콘 을 클릭해 노트북을 편집 모드로 전환합니다.
자원 허브에서 프로젝트를 가져올 때 이 노트북의 첫 번째 셀에는 프로젝트 액세스 토큰이 포함됩니다. 이 노트북에 프로젝트 액세스 토큰이 있는 첫 번째 셀이 없는 경우, 토큰을 생성하려면 계속 메뉴에서 프로젝트 토큰 삽입을 선택하십시오. 이 조치는 새 셀을 프로젝트 토큰을 포함하는 노트북의 첫 번째 셀로 삽입합니다.
IBM Cloud API키 제공 섹션에서 API키를 사용하여 Watson Machine Learning API에 인증 정보를 전달해야 합니다. 아직 저장된 API 키가 없는 경우에는 다음 단계를 수행하여 API 키를 작성합니다.
1. IBM Cloud 콘솔 API 키 페이지에 액세스합니다.
2. IBM Cloud API 키 작성을 클릭하십시오. 기존 API키가 있는 경우 단추에 작성이라는 레이블이 붙을 수 있습니다.
3. 이름 및 설명을 입력하십시오.
4. 작성을 클릭하십시오.
5. 복사 API 키입니다.
6. 나중에 사용할 수 있도록 API 키를 다운로드하십시오.
7. 노트북으로 돌아가서 ibmcloud_api_key 필드에 API키를 붙여넣으십시오.
다음에서 3. 모델 및 배치 섹션에서 space_name, model_name및 deployment_name 변수에 지정된 값을 확인하십시오.
셀 > 모두 실행 을 눌러 노트북의 모든 셀을 실행하십시오. 또는 각 셀 옆에 있는 실행 아이콘 을 클릭해 노트북을 셀 단위로 실행하여 각 셀과 그 출력을 살펴보세요.
노트북을 완료하는 데 1-3분이 소요됩니다. 숫자로 변경되는 별표 "In [*]" (예: "In [1]") 를 확인하여 셀별로 진행 셀을 모니터할 수 있습니다.
노트북 실행 중에 오류가 발생하면 다음 문제점 해결 팁을 시도하십시오.
- 커널 > 다시 시작 및 출력 지우기 를 눌러 커널을 다시 시작한 후 노트북을 다시 실행하십시오.
- 기존 Watson OpenScale 배치를 삭제하고 새 서비스 인스턴스를 프로비저닝하십시오.
- 지정된 아티팩트 이름을 선행 또는 후행 공백 없이 정확하게 복사하고 붙여넣어 배치 공간 및 배치 이름을 작성했는지 확인하십시오.

진행 상황 확인

다음 이미지는 실행이 완료될 때 노트북을 표시합니다. 노트북은 모델에 대한 모니터를 설정하므로 이제 Watson OpenScale에서 배치를 볼 수 있습니다.

태스크 4: 모델 평가

학습서 비디오 미리보기 이 작업을 미리 보려면 03:35부터 시작하는 동영상을 시청하세요.

다음 단계에 따라 검증용 데이터를 다운로드하고 해당 데이터를 사용하여 Watson OpenScale에서 모델을 평가하십시오.

탐색 추적에서 ML 모델 평가 프로젝트를 클릭하십시오.
자산 탭에서 데이터 > 데이터 자산을 클릭하십시오.
오버플로우 메뉴 에서 GoldenBank_HoldoutData.csv 데이터 자산을 클릭하고 다운로드를 선택합니다. 모델이 필요에 따라 작동하는지 확인하려면 모델 훈련에서 제외된 레이블 지정된 데이터 세트가 필요합니다. 이 CSV 파일에는 홀드아웃 데이터가 포함되어 있습니다.
Watson OpenScale을 시작하십시오.
1. 내비게이션 메뉴 에서 서비스 > 서비스 인스턴스를 선택합니다.
2. Watson OpenScale 인스턴스를 클릭하여 서비스 인스턴스 페이지를 여십시오. 프롬프트가 표시되면 Cloud Pak for Data에 등록하는 데 사용한 것과 동일한 인증 정보를 사용하여 로그인하십시오.
  
  참고:인스턴스의 이름이 다를 수 있습니다 (예: `watsonx.governance-xx`).
3. Watson OpenScale 서비스 인스턴스 페이지에서 Watson OpenScale실행을 클릭하십시오.
인사이트 대시보드에서 모기지 승인 모델 배치 타일을 클릭하십시오.
조치 메뉴에서 지금 평가를 선택하십시오.
가져오기 옵션 목록에서 CSV 파일에서를 선택하십시오.
프로젝트에서 다운로드한 Golden Bank_HoldoutData.csv 데이터 파일을 사이드 패널로 끄십시오.
업로드 및 평가 를 클릭하고 평가가 완료될 때까지 기다리십시오.

진행 상황 확인

다음 이미지는 Watson OpenScale에서 배치된 모델에 대한 평가 결과를 표시합니다. 이제 모델을 평가했으므로 모델 품질을 관찰할 준비가 되었습니다.

태스크 5: 품질에 대한 모델 모니터 관찰

학습서 비디오 미리보기 이 작업을 미리 보려면 04:40부터 시작하는 동영상을 시청하세요.

Watson OpenScale 품질 모니터는 모델의 품질을 평가하기 위해 메트릭 세트를 생성합니다. 이러한 품질 메트릭을 사용하여 모델이 결과를 얼마나 잘 예측하는지 판별할 수 있습니다. 검증용 데이터를 사용하는 평가가 완료되면 다음 단계에 따라 모델 품질 또는 정확성을 관찰하십시오.

품질 섹션에서 구성 아이콘 을 클릭합니다. 여기서 이 모니터에 대해 구성된 품질 임계값이 70%이고 사용 중인 품질의 측정이 ROC 곡선 아래 영역임을 확인할 수 있습니다.
모델 요약으로 이동 을 클릭하여 모델 세부사항 화면으로 돌아가십시오.
품질 섹션에서 세부정보 아이콘 을 클릭하면 모델 품질 상세 결과를 확인할 수 있습니다. 여기에는 많은 품질 메트릭 계산 및 거짓 긍정 (false positive) 및 거짓 부정 (false negative) 과 함께 올바른 모델 결정을 표시하는 혼동 매트릭스가 표시됩니다. ROC 곡선 아래의 계산된 영역은 0.9 이상이며 이는 0.7 임계값을 초과하므로 모델이 품질 요구사항을 충족합니다.
탐색 추적에서 모기지 승인 모델 배치 를 클릭하여 모델 세부사항 화면으로 돌아가십시오.

진행 상황 확인

다음 이미지는 Watson OpenScale의 품질 세부사항을 표시합니다. 이제 모델 품질을 관찰했으므로 모델 공정성을 관찰할 수 있습니다.

태스크 6: 공정성을 위해 모델 모니터 관찰

학습서 비디오 미리보기 이 작업을 미리 보려면 05:41부터 시작하는 동영상을 시청하세요.

Watson OpenScale 공정성 모니터는 모델의 공정성을 평가하기 위해 메트릭 세트를 생성합니다. 공정성 메트릭을 사용하여 모델이 편향된 결과를 생성하는지 여부를 판별할 수 있습니다. 모델 공정성을 관찰하려면 다음 단계를 수행하십시오.

공정성 섹션에서 구성 아이콘 을 클릭합니다. 여기에서는 지원자들이 성별에 상관없이 공정하게 대우받을 수 있도록 모델을 검토하고 있다는 것을 알 수 있습니다. 여성은 공정성이 측정되고 있는 모니터링되는 그룹으로서 식별되고, 공정성에 대한 임계값은 적어도 80%가 되는 것입니다. 공정성 모니터는 이질적 영향 방법을 사용하여 공정성을 판별합니다. 분산 영향은 모니터되는 그룹에 대한 선호되는 결과의 백분율을 참조 그룹에 대한 선호되는 결과의 백분율과 비교합니다.
모델 요약으로 이동 을 클릭하여 모델 세부사항 화면으로 돌아가십시오.
공정성 섹션에서 모델 공정성 세부 결과를 보려면 세부 정보 아이콘 을 클릭합니다. 여기에서 자동으로 승인되는 남성 및 여성 지원자의 백분율과 함께 공정성 점수가 100%가 넘는 것을 볼 수 있습니다. 따라서 모델 성과는 필요한 80% 공정성 임계값을 훨씬 초과합니다.
식별된 데이터 세트를 참고하십시오. 공정성 메트릭이 가장 정확한지 확인하기 위해 Watson OpenScale 은 변동을 사용하여 다른 기능이 동일하게 유지되는 동안 보호된 속성 및 관련 모델 입력만 변경되는 결과를 판별합니다. 섭동은 기능의 값을 참조 그룹에서 모니터된 그룹으로 변경하거나 그 반대로 변경합니다. 이러한 추가 가드레일은 "균형" 데이터 세트가 사용될 때 공정성을 계산하는 데 사용되지만 페이로드 또는 모델 훈련 데이터만 사용하여 공정성 결과를 볼 수도 있습니다. 모델이 공정하게 행동하기 때문에, 이 메트릭에 대해 추가로 상세히 설명할 필요가 없습니다.
모기지 승인 모델 배치 탐색 추적을 클릭하여 모델 세부사항 화면으로 돌아가십시오.

진행 상황 확인

다음 이미지는 Watson OpenScale의 공정성 세부사항을 표시합니다. 이제 모델 공정성을 관찰했으므로 모델 설명 가능성을 관찰할 수 있습니다.

태스크 7: 드리프트에 대한 모델 모니터 관찰

학습서 비디오 미리보기 이 작업을 미리 보려면 07:25부터 시작하는 동영상을 시청하세요.

Watson OpenScale 드리프트 모니터는 모델에 대한 일관된 결과를 보장하기 위해 시간 경과에 따른 데이터의 변경사항을 측정합니다. 드리프트 평가를 사용하여 모델 출력의 변경사항, 예측의 정확성 및 입력 데이터의 분포를 식별하십시오. 모델 드리프트를 관찰하려면 다음 단계를 수행하십시오.

드리프트 섹션에서 구성 아이콘 을 클릭합니다. 여기에 드리프트 임계값이 표시됩니다. 출력 드리프트는 모델 신뢰도 분포의 변화를 측정합니다. 모델 품질 드리프트는 예상 런타임 정확도를 훈련 정확도와 비교하여 정확도의 감소를 측정합니다. 기능 드리프트는 중요한 기능에 대한 값 분포의 변경을 측정합니다. 또한 이 구성은 선택된 기능의 수와 가장 중요한 기능을 표시합니다.
모델 요약으로 이동 을 클릭하여 모델 세부사항 화면으로 돌아가십시오.
드리프트 섹션에서 세부정보 아이콘 을 클릭하면 모델 드리프트 상세 결과를 확인할 수 있습니다. 시계열 차트를 사용하여 각 메트릭 점수가 시간 경과에 따라 어떻게 변경되는지에 대한 기록을 볼 수 있습니다. 값이 낮을수록 좋으므로 이 경우 결과는 구성에 설정된 상한 임계값을 초과합니다. 그런 다음 점수 출력 및 기능 드리프트가 계산되는 방법에 대한 세부사항을 보십시오. 또한 각 기능에 대한 세부사항을 보고 Watson OpenScale 이 생성하는 점수에 기여하는 방법을 이해할 수 있습니다.
모기지 승인 모델 배치 탐색 추적을 클릭하여 모델 세부사항 화면으로 돌아가십시오.

진행 상황 확인

다음 이미지는 Watson OpenScale의 드리프트 세부사항을 표시합니다. 이제 모델 드리프트를 관찰했으므로 모델 설명 가능성을 관찰할 수 있습니다.

태스크 8: 설명 가능성에 대한 모델 모니터 관찰

학습서 비디오 미리보기 이 작업을 미리 보려면 08:46부터 시작하는 동영상을 시청하세요.

또한 모델이 어떻게 결정되었는지를 이해하는 것도 중요합니다. 이러한 이해는 대출 승인에 관련된 사람들에게 의사결정을 설명하고 의사결정이 유효한 모델 소유자를 확인하기 위해 필요합니다. 이러한 의사결정을 이해하려면 다음 단계에 따라 모델 설명 가능성을 관찰하십시오.

왼쪽 탐색 패널에서 거래 설명 아이콘 을 클릭합니다.
트랜잭션 목록을 보려면 모기지 승인 모델 배치 를 선택하십시오.
트랜잭션의 경우, 조치 열 아래의 설명을 클릭하십시오. 이 결정에 대한 자세한 설명을 볼 수 있습니다. 각 항목이 최종 결과에 얼마나 중요한지에 따라 모델에 대한 가장 중요한 입력이 표시됩니다. 파란색 막대는 모델의 의사결정을 지원하는 경향이 있는 입력을 표시하는 반면, 빨간색 막대는 다른 의사결정을 초래할 수 있는 입력을 표시합니다. 예를 들어, 신청자는 승인되기에 충분한 수입을 가지고 있을 수 있지만 신용 기록이 불량하고 부채가 많으면 모델이 애플리케이션을 거부하게 됩니다. 모델 결정의 기초에 대해 만족하려면 이 설명을 검토하십시오.
(선택사항) 모델이 결정을 내리는 방법을 자세히 살펴보려면 검사 탭을 클릭하십시오. 검사 기능을 사용하여 소수의 입력에 대한 작은 변경사항으로 인해 다른 의사결정이 발생하는 민감도 영역을 찾기 위한 의사결정을 분석하고, 일부 실제 입력을 대체로 대체하여 결과에 영향을 미치는지 여부를 확인함으로써 사용자가 직접 민감도를 테스트할 수 있습니다.

진행 상황 확인

다음 이미지는 Watson OpenScale에서 트랜잭션의 설명 가능성을 표시합니다. 모델이 정확하고 모든 지원자를 공정하게 처리하는 것으로 판별되었습니다. 이제 해당 라이프사이클의 다음 단계로 모델을 진행할 수 있습니다.

다음 단계

다음 추가 학습서를 사용하여 모델 빌드 및 평가에 대한 보다 실제적인 경험을 얻을 수 있습니다.

추가 자원

비디오를 더 보십시오.
Cloud Pak for Data as a Service 개요

상위 주제: 빠른 시작 학습서