0 / 0
영어 버전 문서로 돌아가기
Data Science및 MLOps 유스 케이스

Data Science및 MLOps 유스 케이스

데이터 분석 및 모델 작성을 운영하려면 엔터프라이즈에 통합 시스템 및 프로세스가 필요합니다. Cloud Pak for Data as a Service 는 엔터프라이즈에서 기계 학습 모델 및 기타 데이터 과학 애플리케이션을 개발하고 배치할 수 있도록 프로세스 및 기술을 제공합니다.

이 비디오를 보고 데이터 사이언스 및 MLOps 솔루션을 구현하기 위한 유스 케이스를 확인하십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

해결 과제

데이터 사이언스 및 MLOps 유스 케이스를 구현하여 엔터프라이즈에 대한 다음과 같은 과제를 해결할 수 있습니다.

고품질 데이터 액세스
조직은 데이터를 사용하여 모델을 구축하는 데이터 과학 팀을 위해 고품질의 통제된 데이터에 쉽게 액세스할 수 있어야 합니다.
모델 빌드 및 배치 조작
조직은 반복 가능한 프로세스를 구현하여 모델을 빠르고 효율적으로 빌드하여 프로덕션 환경에 배치해야 합니다.
모델 모니터링 및 재훈련
조직은 프로덕션 피드백을 기반으로 모델의 모니터링 및 재교육을 자동화해야 합니다.

예: Golden Bank의 과제

골든 은행이 온라인 신청을 위한 저이자율 모기지 갱신을 제공함으로써 비즈니스를 확장하기 위해 데이터 사이언스 및 MLOps 프로세스를 구현하는 과정에서 이 은행의 사례를 따르십시오. 골든 은행의 데이터 과학자들은 위험을 피하고 모든 지원자들을 공정하게 대우하는 모기지 승인 모델을 만들어야 합니다. 또한 모델 재훈련을 자동화하여 모델 성능을 최적화해야 합니다.

프로세스

엔터프라이즈에 대한 데이터 사이언스 및 MLOps를 구현하기 위해 조직은 다음 프로세스를 따를 수 있습니다.

  1. 데이터 준비 및 공유
  2. 모델 빌드 및 훈련
  3. 모델 배포
  4. 모니터 모델
  5. AI 라이프사이클 자동화

Cloud Pak for Data as a Service 의 Watson Studio, Watson Machine Learning, Watson OpenScale및 IBM Knowledge Catalog 서비스는 조직에서 데이터 사이언스 및 MLOps 솔루션을 구현하는 데 필요한 도구 및 프로세스를 제공합니다.

데이터 사이언스 유스 케이스의 플로우를 표시하는 이미지

1. 데이터 준비 및 공유

데이터 과학자는 자체 데이터 세트를 준비하여 카탈로그에서 공유할 수 있습니다. 카탈로그는 데이터 과학자 팀이 필요한 기능을 사용하여 고품질 데이터 자산을 찾을 수 있는 기능 저장소 역할을 합니다. 카탈로그의 데이터 자산을 프로젝트에 추가할 수 있으며, 여기서 데이터를 준비, 분석 및 모델링하기 위해 협업합니다.

사용할 수 있는 항목 수행할 수 있는 작업 다음 경우에 사용
Data Refinery 다양한 데이터 소스 연결에서 데이터에 액세스하고 이를 세분화하십시오.

다른 데이터 과학자가 분석하고 탐색할 수 있도록 데이터를 결합, 결합 또는 필터링할 수 있는 시간 내에 결과 데이터 세트를 스냅샷으로 구체화하십시오.

결과 데이터 세트를 카탈로그에서 사용할 수 있도록 하십시오.
데이터를 쉐이핑하거나 정리하려는 경우 데이터를 시각화해야 합니다.

분석을 위해 대량의 원시 데이터를 준비하는 프로세스를 단순화하려고 합니다.
Catalogs IBM Knowledge Catalog 의 카탈로그를 기능 저장소로 사용하여 조직의 협업자 간에 공유할 자산을 구성하십시오.

AI 기반 시맨틱 검색 및 권장사항을 활용하여 사용자가 필요한 사항을 찾을 수 있도록 지원하십시오.
사용자는 고품질 데이터를 쉽게 이해하고, 협업하고, 강화하고, 액세스해야 합니다.

비즈니스 사용자 간의 데이터 및 협업에 대한 가시성을 높이려고 합니다.

물리적 형식 또는 위치를 이해하지 않고 이동하거나 복사하지 않고도 데이터를 보고, 액세스하고, 조작하고, 분석할 수 있는 사용자가 필요합니다.

사용자는 등급을 지정하고 검토하여 자산을 개선해야 합니다.

예: Golden Bank의 카탈로그

통제 팀 리더는 "모기지 승인 카탈로그" 라는 카탈로그를 작성하고 데이터 스튜워드 및 데이터 과학자를 카탈로그 협업자로 추가합니다. 데이터 스튜워드는 작성한 데이터 자산을 카탈로그에 공개합니다. 데이터 과학자는 카탈로그에서 데이터 스튜어드가 관리하는 데이터 자산을 찾아 해당 자산을 프로젝트에 복사합니다. 프로젝트에서 데이터 과학자는 데이터를 세분화하여 모델 훈련을 준비할 수 있습니다.


2. 모델 빌드 및 훈련

데이터를 기반으로 예측 인사이트를 얻기 위해 데이터 과학자, 비즈니스 분석가, 머신 러닝 엔지니어가 모델을 빌드하고 훈련할 수 있습니다. 데이터 과학자는 Cloud Pak for Data as a Service 서비스를 사용하여 AI 모델을 빌드함으로써 비즈니스 문제점을 해결하는 데 도움이 되는 예측을 작성하는 데 올바른 알고리즘 및 최적화가 사용되도록 합니다.

사용할 수 있는 항목 수행할 수 있는 작업 다음 경우에 사용
AutoAI Watson Studio 에서 AutoAI 를 사용하여 알고리즘을 자동으로 선택하고, 기능을 엔지니어링하고, 파이프라인 후보를 생성하고, 모델 파이프라인 후보를 훈련시키십시오.

그런 다음, 순위가 지정된 파이프라인을 평가하고, 모델로서 최상의 항목을 저장하십시오.

훈련된 모델을 영역에 배치하거나, AutoAI 에서 노트북으로 원하는 모델 훈련 파이프라인을 내보내서 세분화하십시오.
우수한 훈련 파이프라인 및 모델 세트를 신속하게 빌드하기 위한 고급 및 자동화된 방법을 원합니다.

생성된 파이프라인을 내보내어 세분화할 수 있기를 원합니다.
노트북 및 스크립트 Watson Studio 의 노트북 및 스크립트를 사용하여 Python 또는 R에서 사용자 고유의 기능 엔지니어링 모델 훈련 및 평가 코드를 작성하십시오. 프로젝트에서 사용 가능한 훈련 데이터 세트 또는 데이터베이스, 데이터 레이크 또는 오브젝트 스토리지와 같은 데이터 소스에 대한 연결을 사용하십시오.

선호하는 오픈 소스 프레임워크 및 라이브러리가 있는 코드.
Python 또는 R 코딩 스킬을 사용하여 모델을 작성, 훈련 및 평가하는 데 사용되는 코드를 완전히 제어할 수 있습니다.
SPSS Modeler 플로우 Watson Studio 에서 SPSS Modeler 플로우를 사용하여 자체 모델 훈련, 평가 및 스코어링 플로우를 작성하십시오. 프로젝트에서 사용 가능한 훈련 데이터 세트 또는 데이터베이스, 데이터 레이크 또는 오브젝트 스토리지와 같은 데이터 소스에 대한 연결을 사용하십시오. 데이터를 탐색하고 모델 훈련, 평가 및 스코어링 플로우를 정의하는 간단한 방법을 원합니다.
RStudio RStudio에서 R을 사용하여 데이터를 분석하고 모델을 빌드 및 테스트합니다. R에서 작업하기 위해 개발 환경을 사용하려고 합니다.
Decision Optimization 데이터 준비, 모델 가져오기, 문제점 해결 및 시나리오 비교, 데이터 시각화, 솔루션 찾기, 보고서 생성, Watson Machine Learning을 사용하여 배치할 모델 저장을 수행합니다. 수백만 개의 가능성을 평가하여 처방 분석 문제점에 대한 최상의 솔루션을 찾아야 합니다.
연합 학습 분산 데이터를 사용하는 공통 모델을 훈련합니다. 여러 위치에 분산된 데이터를 이동, 결합 또는 공유하지 않고 모델을 훈련해야 합니다.

예: Golden Bank의 모델 작성 및 훈련

골든 은행의 데이터 과학자들은 예측하지 못한 위험을 피하고 모든 지원자들을 공정하게 대우하는 "모기지 승인 모델" 이라는 모델을 만들었습니다. 처음부터 모델의 히스토리 및 성과를 추적하려고 하므로 "모기지 승인 카탈로그" 에 모델 유스 케이스를 추가합니다. 이들은 노트북을 통해 모델을 구축하고 담보 대출을 받을 수 있는 신청자를 예측합니다. 모델 훈련의 세부사항은 모델 유스 케이스에서 자동으로 메타데이터로 캡처됩니다.


3. 모델 배치

운영팀 구성원이 AI 모델을 배치하면 애플리케이션에 해당 모델을 사용할 수 있게 되어 이 조치를 유도하는 데 도움이 되는 스코어링 및 예측에 사용할 수 있습니다.

사용할 수 있는 항목 수행할 수 있는 작업 다음 경우에 사용
공간 사용자 인터페이스 공간 UI를 사용하여 프로젝트에서 공간으로 모델 및 기타 자산을 배치하십시오. 협업 작업 영역에서 모델을 전개하고 전개 정보를 보려고 합니다.


예: Golden Bank의 모델 배치

골든 은행의 운영 팀 구성원은 "모기지 승인 모델" 을 프로젝트에서 배치 영역으로 승격한 후 온라인 모델 배치를 작성합니다.


4. 배치된 모델 모니터

모델이 배치된 후에는 제대로 수행되는지 확인하기 위해 모델을 모니터하는 것이 중요합니다. 데이터 과학자는 모델 성능 및 데이터 일관성 문제를 감시해야 합니다.

사용할 수 있는 항목 수행할 수 있는 작업 다음 경우에 사용
Watson OpenScale 여러 기능에서 모델 공정성 문제를 모니터합니다.

시간 경과에 따라 모델 성능 및 데이터 일관성을 모니터합니다.

가중치 요인을 사용하여 모델이 특정 예측에 도달하는 방법을 설명합니다.

조직에서 모델 통제 및 라이프사이클을 유지보수하고 보고합니다.
보호되거나 예측 공정성에 기여할 수 있는 기능이 있습니다.

시간 경과에 따른 모델 성능 및 데이터 일관성을 추적하려고 합니다.

모델이 특정 예측을 제공하는 이유를 알고자 합니다.

예: Golden Bank의 모델 모니터링

골든 은행의 데이터 과학자는 Watson OpenScale 을 사용하여 배치된 "모기지 승인 모델" 을 모니터하여 정확하고 모든 골든 은행 모기지 신청자를 공정하게 처리하는지 확인합니다. 노트북을 실행하여 모델에 대한 모니터를 설정한 후 Watson OpenScale 사용자 인터페이스를 사용하여 구성을 조정합니다. 데이터 과학자는 Watson OpenScale 품질 모니터 및 공정성 모니터의 메트릭을 사용하여 모델이 결과를 얼마나 잘 예측하고 편향된 결과를 생성하는지 판별합니다. 또한 모기지 신청자에게 의사결정을 설명할 수 있도록 모델이 의사결정에 도달하는 방법에 대한 인사이트를 얻습니다.


5. ML 라이프사이클 자동화

팀은 Watson Pipelines을 사용하여 MLOps및 AI 라이프사이클을 자동화하고 간소화할 수 있습니다.

사용할 수 있는 항목 수행할 수 있는 작업 다음 경우에 사용
Watson Pipelines 파이프라인을 사용하여 데이터 수집에서 모델 훈련, 테스트 및 배치에 이르기까지 노트북, Data Refinery및 기계 학습 파이프라인을 자동화하는 반복 가능하고 스케줄된 플로우를 작성하십시오. MLOps 플로우의 일부 또는 모든 단계를 자동화하려고 합니다.

예: Golden Bank의 자동화된 ML 라이프사이클

골든 은행의 데이터 과학자는 파이프라인을 사용하여 전체 데이터 사이언스 및 MLOps 라이프사이클 및 프로세스를 자동화함으로써 모델 재훈련 프로세스를 간소화할 수 있습니다.


Data Science및 MLOps 학습서

Tutorial 설명 학습서에 대한 전문 지식
모델 모니터링을 사용하여 AI 파이프라인 조정 모델을 훈련하고, 이를 배치 공간으로 프로모션시키고 모델을 배치하십시오. 노트북을 실행하십시오.
데이터 통합으로 AI 파이프라인 조정 데이터를 준비하고 모델을 훈련하는 엔드-투-엔드 파이프라인을 작성합니다. Watson Pipelines 끌어서 놓기 인터페이스를 사용하여 파이프라인을 작성하십시오.

자세한 정보

상위 주제: 유스 케이스

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기