다양한 서비스와 함께 Cloud Pak for Data 를 사용하여 AI 운영을 위한 신뢰할 수 있는 데이터 기반을 구축하는 데 도움이 되는 유스 케이스를 구현할 수 있습니다.
데이터 패브릭 솔루션 개요
Cloud Pak for Data에서 데이터 패브릭 솔루션을 구현할 때 데이터 액세스, 데이터 품질, 데이터 거버넌스 및 데이터 라이프사이클 관리의 과제를 해결할 수 있습니다.
Cloud Pak for Data 의 데이터 패브릭 솔루션은 데이터 라이프사이클을 관리하고 자동화하기 위한 다음과 같은 기본 기능을 제공합니다.
- 데이터 액세스
- 기존 데이터 아키텍처의 여러 클라우드 및 온프레미스에서 데이터에 액세스할 수 있습니다.
- 셀프 서비스 이용
- 카탈로그에서 엔터프라이즈 전체의 데이터 및 기타 자산을 공유하고 사용합니다.
- 누적된 지식
- 공통 비즈니스 어휘를 통해 데이터를 이해합니다. 히스토리, 계보 및 품질 분석을 통해 데이터를 신뢰합니다.
- 협업 혁신
- 다른 사용자와 협업하여 인사이트를 발견합니다. 모든 수준의 경험을 위한 통합 도구 세트를 사용하여 데이터를 준비하고 분석합니다.
- 거버넌스 및 준수
- 데이터 개인정보 보호를 적용하기 위한 규칙을 정의합니다.
- 통합된 라이프사이클
- 데이터 파이프라인의 빌드, 테스트, 배치 및 모니터링을 자동화합니다.
다음 그림은 하이브리드 데이터 소스 (예: 데이터 레이크하우스, 데이터 웨어하우스, 데이터 레이크, 데이터베이스 또는 비즈니스 애플리케이션) 에 대한 액세스를 단일 UI 경험의 기능과 통합하여 데이터 패브릭이 Cloud Pak for Data 플랫폼 (클라우드 및 온프레미스 모두) 에서 유스 케이스를 지원하는 방법을 보여줍니다.
자산의 가치
데이터 패브릭을 사용하여 의미와 가치를 축적하는 자산으로 데이터를 변환할 수 있습니다. 자산은 단순한 데이터 이상입니다. 데이터 소스에 대한 연결을 처음 작성할 때 데이터, 테이블, 스키마 및 데이터 값에 액세스하는 방법에 대한 기본 정보가 있습니다. 프로젝트라는 작업공간에서 데이터를 가상화, 변환 또는 복제하여 데이터를 수집하는 동안 값을 추가하기 시작합니다.
데이터를 큐레이트할 때 데이터 자산에 메타데이터를 추가합니다. 데이터를 분류하고 값에 대한 통계를 컴파일하기 위해 데이터를 프로파일링합니다. 조직에 대한 데이터의 시맨틱 의미를 설명하는 비즈니스 어휘를 사용하여 자산을 강화합니다. 데이터 품질을 분석합니다. 큐레이션 중에 추가하는 메타데이터는 기계 학습 프로세스를 통해 자동으로 생성되므로 활성 메타데이터로 간주됩니다. 데이터가 변경된 후에 큐레이션을 다시 실행하면 자동화된 데이터 분석을 기반으로 메타데이터가 업데이트됩니다.
사용자가 프로젝트에서 자산을 사용할 때 자산이 사용되는 방법의 히스토리 및 자산 간 관계를 설명하는 세 번째 레벨의 의미를 작성합니다. 사용자는 노트북 또는 대시보드에서 데이터를 분석하거나 기계 학습 모델을 훈련할 수 있습니다.
평가 및 검토, 데이터 시각화, 태그 및 기타 관계와 같은 정보를 자산에 추가할 수도 있습니다.
다음 이미지는 데이터 자산에 대한 기본 정보 (데이터 유형, 형식 및 스키마, 데이터가 상주하는 위치) 에 설명 정보 (데이터 프로파일, 데이터 품질 및 비즈니스 어휘), 사용 정보 (데이터 및 관계에 대한 조치) 및 사용자 추가 정보 (등급 및 검토, 시각화 및 관계) 를 추가하여 데이터 자산이 데이터 패브릭에서 값을 누적하는 방법을 보여줍니다.
데이터 패브릭 유스 케이스
Cloud Pak for Data 는 데이터 패브릭 솔루션의 일부로 여러 유스 케이스를 제공합니다. 기능 및 도구를 제공하는 하나 이상의 서비스를 설치하여 각 유스 케이스에 표시된 대로 데이터 패브릭을 구현합니다. 일부 서비스는 여러 유스 케이스에 포함되어 있습니다.
유스 케이스는 다른 파트를 빌드하는 동안 팀이 작업을 시작할 수 있도록 데이터 패브릭 솔루션의 파트를 구현하는 방법을 나타냅니다. 모든 유스 케이스를 시작하고 필요에 따라 다른 유스 케이스를 추가할 수 있습니다.
- 보다 성숙한 데이터 통제 모델이 있는 경우 데이터 통제 유스 케이스에 설명된 대로 비즈니스 어휘를 설정하여 시작하십시오.
- 가치 실현 시간을 단축하려면 데이터 통합 유스 케이스에 설명된 대로 데이터 가상화 또는 데이터 복제를 시작하십시오.
- 사용자 및 시스템에 고객 데이터에 대한 전체적이고 신뢰할 수 있으며 통합된 보기가 있는지 확인해야 하는 경우 마스터 데이터 관리 유스 케이스에 설명된 대로 레코드 데이터를 일치시키고 개별 엔티티로 통합하여 시작하십시오.
각 유스 케이스를 탐색하여 수행할 수 있는 작업 및 사용할 수 있는 도구에 대해 학습하십시오.
데이터 거버넌스
비즈니스 지식을 제공하고 데이터 보호를 정의하는 메타데이터를 기반으로 거버넌스를 구현합니다. 셀프 서비스 카탈로그에 고품질 데이터 자산을 제공합니다. 규제 준수를 위한 데이터 거버넌스의 적용을 자동화합니다.
IBM Knowledge Catalog유스 케이스에 대한 서비스입니다.
데이터 거버넌스 유스 케이스를 참조하십시오.
데이터 통합
이동하지 않고 모든 데이터에 대한 액세스를 간소화하고 자동화합니다. 분산된 환경에서 데이터를 조정하여 데이터 이용자가 즉시 사용할 수 있는 정보 네트워크를 구축합니다.
이 사용 사례를 위한 서비스: Data Virtualization, DataStage,, IBM Knowledge Catalog.
데이터 통합 유스 케이스를 참조하십시오.
Master Data Management
도메인 전체에서 데이터를 연결하고 마스터 데이터 엔티티를 작성하기 위해 데이터를 일치시켜 고객 및 레코드 데이터의 통합된 보기를 빌드합니다.
이 유스 케이스에 대한 서비스: IBM Match 360 with Watson.
AI 유스 케이스 빌드 및 통제
AI 유스 케이스 빌드 및 통제를 구현할 때 모델 빌드, AI 통제 및 AI 라이프사이클 관리의 과제를 해결할 수 있습니다.
Cloud Pak for Data 의 빌드 및 통제 AI 유스 케이스는 AI 라이프사이클을 관리하고 자동화하기 위한 다음과 같은 기본 기능을 제공합니다.
- 협업 혁신
- 다른 사용자와 협업하여 인사이트를 발견합니다. 모든 레벨의 경험을 위한 통합 도구 세트를 사용하여 데이터를 준비하고 데이터를 분석하며 모델을 빌드합니다.
- 거버넌스 및 준수
- AI 모델의 세부 히스토리를 추적하고 문서화하여 컴플라이언스를 보장합니다.
- 통합된 라이프사이클
- AI 모델의 빌드, 테스트, 배치 및 모니터링을 자동화합니다.
Cloud Pak for Data 두 가지 AI 사용 사례 구축 및 관리 기능을 제공합니다. 기능 및 도구를 제공하는 하나 이상의 서비스 인스턴스를 작성하여 각 유스 케이스를 구현합니다. 일부 서비스는 여러 유스 케이스에 포함되어 있습니다.
두 유스 케이스 중 하나로 시작하여 필요에 따라 다른 유스 케이스를 추가할 수 있습니다.
- 빠른 가치 창출 시간을 원하는 경우 데이터 사이언스 및 MLOps 유스 케이스에 설명된 대로 데이터 사이언스부터 시작하십시오.
- 모델이 조직의 목표 및 규정을 준수하는지 확인해야 하는 경우 AI 통제 유스 케이스에 설명된 대로 모델 추적을 시작하십시오.
각 유스 케이스를 탐색하여 수행할 수 있는 작업 및 사용할 수 있는 도구에 대해 학습하십시오.
데이터 사이언스 및 MLOps
데이터, 빌드, 배치, 모니터 및 재훈련 모델을 준비하는 자동화된 워크플로우를 사용하여 데이터 분석 및 모델 작성을 조작할 수 있습니다.
이 사용 사례를 위한 서비스: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale 및 IBM Knowledge Catalog.
데이터 사이언스 및 MLOps 유스 케이스를 참조하십시오.
AI 거버넌스
모델에서 공정성, 품질 및 설명 가능성을 적용하는 자동화된 워크플로우를 사용하여 AI 거버넌스를 운영합니다.
이 사용 사례를 위한 서비스: watsonx.ai Studio, watsonx.ai Runtime, Watson OpenScale 및 IBM Knowledge Catalog.
AI 통제 유스 케이스를 참조하십시오.