0 / 0
영어 버전 문서로 돌아가기
MLOps와 신뢰할만한 AI 사용 사례
MLOps와 신뢰할만한 AI 사용 사례

MLOps와 신뢰할만한 AI 사용 사례

AI 라이프사이클에서 데이터 및 모델 자산을 관리하려면 엔터프라이즈에 통합 시스템 및 프로세스가 필요합니다. Cloud Pak for Data as a Service 은 엔터프라이즈가 프로덕션에서 기계 학습 (ML) 및 AI 모델을 개발, 배치, 유지보수 및 관리할 수 있도록 하는 프로세스 및 기술을 제공합니다.

Cloud Pak for Data에서 솔루션을 구현하는 데 필요한 데이터 패브릭 유스 케이스를 보려면 이 비디오를 보십시오.

이 비디오는 이 문서에 기록된 단계를 수행하는 방법의 대안인 시각적 메소드를 제공합니다.

인증 확인

엔터프라이즈에 대한 MLOps and trustworthy AI 솔루션을 설정하려면 다음과 같은 과제를 해결해야 합니다.

데이터 액세스
조직은 데이터를 사용하여 신뢰할 수 있는 AI및 ML 애플리케이션을 빌드하는 데이터 과학 팀의 통합 및 통제된 데이터에 쉬운 액세스를 제공해야 합니다.

모델 운영
조직은 반복 가능한 프로세스를 구현하여 모델을 빌드 및 배치하고 프로덕션 환경에서 모델을 채택해야 합니다.

모델 통제 및 준수 확인
조직은 모델이 설명 가능하고 유효하며 정확한지 확인하기 위해 프로덕션에서 모델을 모니터해야 하며 의도된 목표에서 편향되거나 편향되지 않도록 합니다.

Cloud Pak for Data as a Service에서 데이터 패브릭을 사용하여 MLOps 자동화된 수명 주기를 구현하여 이러한 문제를 해결할 수 있습니다.


예제: 골든 뱅크의 과제

온라인 애플리케이션에 대해 낮은 비율의 모기지 갱신을 제공하여 비즈니스를 확장하기 위해 MLOps and trustworthy AI 프로세스를 구현하기 때문에 골든 뱅크의 사례를 따르십시오. 골든 뱅크의 데이터 과학자들은 예측할 수 없는 위험을 피하고 모든 지원자들을 공정하게 대우하는 모기지 승인 모델을 만들어야 한다.

프로세스

엔터프라이즈에 대해 MLOps and trustworthy AI 를 구현하기 위해 조직은 다음 프로세스를 따를 수 있습니다.

  1. 데이터 공유
  2. 모델 빌드 및 훈련
  3. 모델 배치
  4. 모니터 모델
  5. 모델 추적
  6. AI 라이프사이클 자동화

Cloud Pak for Data as a Service 의 Watson Studio, Watson Machine Learning, Watson OpenScale및 Watson Knowledge Catalog 서비스는 조직에서 MLOps and trustworthy AI 솔루션을 구현하는 데 필요한 도구 및 프로세스를 제공합니다.

MLOps및 트러스가치 AI 활용 사례의 흐름을 보여주는 이미지

1. 데이터 공유

카탈로그는 데이터 과학자 팀이 필요한 기능으로 고품질의 데이터 자산을 찾을 수 있는 기능 저장소로 사용됩니다. 카탈로그에서 데이터 자원을 프로젝트에 추가하여 데이터를 준비, 분석 및 모델링하기 위해 협업합니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
카탈로그 Watson Knowledge Catalog 의 카탈로그를 기능 저장소로 사용하여 조직의 협력자 간에 공유할 자산을 구성할 수 있습니다.

AI 기반 시맨틱 검색 및 권장사항을 활용하여 사용자가 필요한 사항을 찾을 수 있도록 합니다.
사용자는 고품질의 데이터를 쉽게 이해하고, 협업하고, 보강하고, 액세스할 필요가 있습니다.

비즈니스 사용자 간에 데이터 및 협업의 가시성을 향상시키려고 합니다.

사용자는 실제 형식이나 위치를 이해하지 않고도 데이터를 보고, 액세스하고, 조작하고, 분석할 필요가 없습니다.

사용자가 등급별로 자산을 향상시키고 검토해야 합니다.


예제: 골든 뱅크의 카탈로그

통제 팀 리더는 카탈로그인 "모기지 승인 카탈로그" 를 작성하고 데이터 스튜어드 및 데이터 과학자를 카탈로그 협력자로 추가합니다. 데이터는 카탈로그에 작성된 데이터 자산을 공개합니다. 데이터 과학자는 데이터 자산을 기준으로 데이터 자산을 카탈로그에서 찾고 해당 자산을 프로젝트에 복사합니다. 데이터 과학자들은 그들의 프로젝트에서 데이터를 정제하여 모델 훈련에 대비할 수 있다.


2. 모델 구축 및 훈련

데이터를 기반으로 예측 통찰력을 얻기 위해 데이터 과학자, 비즈니스 분석가 및 시스템 학습 엔지니어가 모델을 빌드하고 훈련할 수 있습니다. 데이터 과학자들은 Cloud Pak for Data as a Service 서비스를 사용하여 AI 모델을 구축하고, 올바른 알고리즘과 최적화를 사용하여 비즈니스 문제를 해결하는 데 도움이 되는 예측을 수행할 수 있도록 합니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
AutoAI Watson Studio 에서 AutoAI 를 사용하여 알고리즘, 엔지니어 기능을 자동으로 선택하고 파이프라인 후보를 생성하고 모델 파이프라인 후보를 훈련합니다.

그런 다음, 순위가 지정된 파이프라인을 평가하고 최상의 모델을 모델로 저장하십시오.

배치 훈련된 모델을 공백으로 이동하거나 AutoAI 에서 원하는 모델 교육 파이프라인을 노트북으로 내보내어 세분화하십시오.
우수한 교육 파이프라인 및 모델 세트를 신속하게 빌드하기 위해 고급 및 자동화된 방법을 원합니다.

생성된 파이프라인을 세분화하여 반출할 수 있습니다.
노트북과 스크립트 Watson Studio 의 노트북 및 스크립트를 사용하여 고유의 기능 엔지니어링 모델 교육, Python의 평가 코드 또는 프로젝트에서 사용 가능한 교육 데이터 세트 또는 데이터베이스, 데이터 레이크 또는 오브젝트 스토리지와 같은 데이터 소스에 대한 연결을 작성할 수 있습니다.

선호하는 알고리즘 및 라이브러리를 사용하십시오.
Python 또는 R 코딩 기술을 사용하여 모델을 작성, 훈련 및 평가하는 데 사용되는 코드를 완전히 제어할 수 있습니다.
SPSS Modeler 플로우 Watson Studio 에서 SPSS Modeler 플로우를 사용하여 프로젝트에서 사용할 수 있는 훈련 데이터 세트 또는 데이터베이스, 데이터 레이크 또는 오브젝트 스토리지와 같은 데이터 소스에 대한 연결을 기반으로 자체 모델 훈련, 평가 및 스코어링 플로우를 작성할 수 있습니다. 데이터를 탐색하고 모델 훈련, 평가 및 스코어링 플로우를 정의하는 간단한 방법을 원합니다.
RStudio R3.6 개발 환경을 사용하여 RStudio Server 에서 R에 대해 작업하여 데이터를 분석하고 모델을 작성하고 테스트한다. 개발 환경을 사용하여 R 에서 작업하려고 합니다.
Decision Optimization 데이터 준비, 모델 가져오기, 문제점 해결 및 시나리오 비교, 데이터 시각화, 솔루션 찾기, 보고서 생성 및 Watson Machine Learning으로 배치할 모델 저장 수많은 가능성을 평가하여 규범적인 분석 문제에 대한 최상의 솔루션을 찾아야 합니다.
연합 학습 분산 데이터를 사용하여 공통 모델을 훈련합니다. 여러 위치에 분산되어 있는 데이터를 이동, 결합 또는 공유하지 않고 모델을 훈련해야 합니다.


예제: 골든 뱅크의 모델 작성 및 교육

골든 뱅크의 데이터 과학자들은 예측되지 않은 위험을 피하고 모든 지원자들을 공정하게 대우하는 "모기지 승인 모델" 모델을 만든다. 처음부터 모델의 히스토리 및 성능을 추적하기 위해 모델 항목을 "모기지 승인 카탈로그" 에 추가합니다. 그들은 모델을 만들기 위해 공책을 실행하고, 모기지에 대한 지원자들의 자격을 예측한다. 모델 교육의 세부사항은 모델 항목의 메타데이터로 자동 캡처됩니다.


3. 전개 모델

운영팀 구성원이 AI 모델을 배치하면 애플리케이션에 해당 모델을 사용할 수 있게 되어 이 조치를 유도하는 데 도움이 되는 스코어링 및 예측에 사용할 수 있습니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
Spaces 사용자 인터페이스(UI) 프로젝트에서 공간으로 모델 및 기타 자산을 배치하려면 Watson Machine Learning 의 공간 UI를 사용하십시오. UI를 사용하는 것을 선호한다.
명령행 도구(cpdctl) Watson Machine Learning 의 cpdctl 명령행 도구를 사용하여 구성 설정을 포함한 모델의 수명 주기를 관리하고 모델 훈련, 저장, 배치 공간 작성 및 모델 배치를 포함하는 엔드-투-엔드 플로우를 자동화할 수 있습니다. 명령행에서 테스트 또는 프로덕션 환경으로 모델을 배치하고 관리하려고 합니다.


예제: 골든 뱅크의 모델 배치

골든 뱅크의 운영 팀 구성원은 프로젝트에서 배치 공간으로 "모기지 승인 모델" 을 홍보한 후 온라인 모델 배치를 작성합니다.


4. 배치된 모델 모니터

모델이 배치된 후에는 모델을 관리하고 모니터하여 모델이 해석 가능하고 투명한지 확인하는 것이 중요합니다. 데이터 과학자는 예측이 암시적 또는 명시적 편향성을 가지는지 여부를 판별할 수 있도록 모델이 특정 예측에 도달하는 방법을 설명할 수 있어야 합니다. 또한 모델의 라이프사이클 동안 모델 성능 및 데이터 일관성 문제를 확인하는 것이 가장 좋습니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
Watson OpenScale 모니터 모델의 공정성 문제가 여러 기능에 걸쳐 발생합니다.

시간에 따른 모델 성능 및 데이터 일관성을 모니터합니다.

모델이 특정 예측에 도달하는 방법을 설명합니다.

조직에서 모델 통제 및 라이프사이클을 유지하고 보고합니다.
보호되거나 예측 공정성에 기여할 수 있는 기능이 있는 경우,

시간에 따라 모델 성능 및 데이터 불일치를 추적해야 합니다.

모델이 특정 예측을 제공하는 이유를 알아야 합니다.


예제: 골든 뱅크의 모델 모니터링

골든 뱅크의 데이터 과학자들은 Watson OpenScale 을 사용하여 배치된 "모기지 승인 모델" 을 모니터하여 모든 골든 뱅크 모기지 신청자를 공정하고 정확하게 처리할 수 있습니다. 노트북을 실행하여 모델에 대한 모니터를 설정한 후 Watson OpenScale 사용자 인터페이스를 사용하여 구성을 변경합니다. Watson OpenScale 품질 모니터 및 공정성 모니터의 메트릭을 사용하여 데이터 과학자는 모델이 결과를 얼마나 잘 예측하고 편향된 결과를 생성하는지를 판별합니다. 이들은 또한 결정이 모기지 신청자들에게 설명될 수 있도록 모델이 어떻게 결정되는지에 대한 이해를 얻는다.


5. 트랙 모델

공정성 및 설명 불가능을 위해 모델을 모니터링하는 것 외에도 팀은 프로덕션 모델을 추적하여 제대로 수행되는지 확인해야 합니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
페이트시트 Watson Knowledge Catalog에 있는 카탈로그의 모델 인벤토리에서 모든 등록된 자산의 라이프사이클 상태를 보고 모델 항목에 등록된 모델 또는 배치의 자세한 fact시트로 드릴 다운하십시오.

일반 모델 세부사항, 훈련 정보 및 메트릭, 입력 및 출력 스키마를 봅니다.

일반 배치 세부사항, 평가 세부사항, 품질 메트릭, 공정성 세부사항 및 드리프트 세부사항을 보십시오.
모델이 예상대로 수행되고 있는지 확인하려고 합니다.

조정해야 하는지 여부를 판별하려고 합니다.


예제: 골든 뱅크의 모델 추적

골든 뱅크의 비즈니스 분석가들은 "모기지 승인 모델" 을 요청한다. 그들은 데이터 과학자들이 모델을 구축하고 훈련시키고, 모뎀 엔지니어들이 이를 배치하고 평가함에 따라 AI 수명 주기의 모든 단계를 통해 모델을 추적할 수 있다. 팩트 시트는 모델 히스토리에 대한 세부사항을 문서화하고 성능을 표시하는 메트릭을 생성합니다.


6. ML 수명 주기 자동화

팀은 Watson Studio 파이프라인 (베타) 을 사용하여 MLOps및 AI 라이프사이클을 자동화하고 단순화할 수 있습니다.

당신이 사용할 수 있는 것 수행할 수 있는 작업 다음 경우에 사용
파이프라인 (베타) Watson Studio 의 파이프라인을 사용하여 데이터 수집에서 모델 교육, 테스트 및 배치까지 노트북, Data Refinery및 시스템 학습 파이프라인을 자동화하는 반복 가능하고 스케줄된 플로우를 작성할 수 있습니다. MLOps 플로우의 모든 단계 또는 모든 단계를 자동화하려고 합니다.


예제: 골든 뱅크의 자동화된 ML 수명 주기

또한 골든 뱅크의 데이터 과학자는 파이프라인을 사용하여 완전한 MLOps and trustworthy AI 라이프사이클 및 프로세스를 자동화하여 모기지 승인 프로세스를 간소화할 수 있습니다.


MLOps and trustworthy AI 학습서

Tutorial 설명 학습서에 대한 전문 지식
모델 빌드 및 배치 모델을 훈련하고, 이를 배치 공간으로 프로모션시키고 모델을 배치하십시오. 노트북을 실행하십시오.
모델 테스트 및 검증 정확성, 공정성 및 설명 가능성을 위해 모델을 평가합니다. 노트북을 실행하고 사용자 인터페이스의 결과를 보십시오.

자세히 보기

상위 주제: 데이터 패브릭 솔루션 개요