0 / 0
영어 버전 문서로 돌아가기
데이터 패브릭 솔루션 개요

데이터 패브릭 솔루션 개요

Cloud Pak for Data에서 데이터 패브릭 솔루션을 구현할 때 데이터 액세스, 데이터 품질, 데이터 거버넌스, 데이터 및 AI 라이프사이클의 관리 문제를 해결할 수 있습니다.

Cloud Pak for Data 의 데이터 패브릭 솔루션은 데이터 및 AI 라이프사이클을 관리하고 자동화하는 데 필요한 기본 기능을 제공합니다.

데이터 액세스
기존 데이터 아키텍처의 여러 클라우드 및 사내 구축 환경에서 데이터에 액세스합니다.
셀프 서비스 이용
카탈로그의 엔터프라이즈에서 데이터 및 기타 자산을 공유하고 사용합니다.
누적된 지식
공통 비즈니스 어휘를 통해 데이터를 이해하십시오. 히스토리, 계보 및 품질 분석을 통해 데이터를 신뢰할 수 있습니다.
협업 혁신
다른 사용자와 협업하여 통찰력을 발견합니다. 데이터를 준비하고 데이터를 분석하며 모든 레벨의 경험을 위해 통합 도구 세트를 사용하여 모델을 작성합니다.
통제 및 규제 준수
데이터 개인정보 보호정책을 적용하는 규칙을 정의합니다. 준수를 확인하기 위해 AI 모델의 세부 히스토리를 추적하고 문서화합니다.
통합된 라이프사이클
데이터 파이프라인 및 AI 모델의 빌드, 테스트, 배치 및 모니터링을 자동화합니다.

자산의 가치

데이터 패브릭을 사용하면 의미 및 값을 누적하는 자산으로 데이터를 변환할 수 있습니다. 자산은 단순한 데이터 이상입니다. 데이터 소스에 대한 연결을 처음 작성할 때 데이터, 테이블, 스키마 및 데이터 값에 액세스하는 방법에 대한 기본 정보가 있습니다. 프로젝트라고 하는 작업공간에서 이를 가상화, 변환 또는 복제하여 데이터를 수집하는 동안 값을 추가하기 시작합니다.

데이터를 큐레이트할 때 데이터 자산에 메타데이터를 추가합니다. 데이터를 프로파일하여 이를 분류하고 값에 대한 통계를 컴파일합니다. 조직에 대한 데이터의 시맨틱 의미를 설명하는 비즈니스 어휘가 있는 자산이 풍부합니다. 데이터 품질을 분석합니다. 큐레이션 중에 추가하는 메타데이터는 기계 학습 프로세스를 통해 자동으로 생성되므로 활성 메타데이터로 간주됩니다. 데이터가 변경된 후에 큐레이션을 다시 실행하면 자동화된 데이터 분석을 기반으로 메타데이터가 업데이트됩니다.

사용자가 프로젝트에서 자산을 사용할 때 자산이 사용되는 방법의 히스토리와 자산 간의 관계를 설명하는 세 번째 레벨의 의미를 작성합니다. 사용자는 노트북 또는 대시보드의 데이터를 분석하거나 기계학습 모델을 교육할 수 있습니다.

사용자는 자산에 정보 (예: 평가 및 검토, 데이터의 시각화, 태그 및 기타 관계) 를 추가할 수도 있습니다.

다음 이미지는 데이터 패브릭에서 데이터 자산이 값을 누적하는 방법을 보여줍니다.

데이터 자산이 값을 누적하는 방법을 표시하는 이미지입니다.

모델도 자산입니다. 모델의 배치 및 입력 데이터, 모델 간 비교, 회사 프로토콜 준수 및 기타 성능 지표를 추적할 수 있습니다.

사용 사례

Cloud Pak for Data as a Service 은 데이터 패브릭 솔루션의 일부로 네 가지 유스 케이스를 제공합니다. 기능 및 도구를 제공하는 하나 이상의 서비스 인스턴스를 작성하여 각 유스 케이스에 표시된 대로 데이터 패브릭을 구현합니다. 일부 서비스는 여러 유스 케이스에 포함되어 있습니다.

4개의 데이터 패브릭 유스 케이스를 표시하는 이미지

유스 케이스는 다른 파트를 빌드하는 동안 팀이 작업을 시작할 수 있도록 데이터 패브릭 솔루션의 일부를 구현하는 방법을 나타냅니다. 유스 케이스로 시작하여 필요에 따라 다른 케이스를 추가할 수 있습니다.

  • 보다 성숙한 데이터 통제 모델이 있는 경우, 데이터 통제 유스 케이스에 설명된 대로 비즈니스 어휘를 설정하여 시작하십시오.
  • 데이터 통합 및 데이터 과학 및 MLOps 유스 케이스에서 설명한 바와 같이, 더 빠른 시간 대 가치를 원하는 경우 데이터 가상화 또는 데이터 과학으로 시작하십시오.
  • 모델이 조직의 목표 및 규정을 준수하는지 확인해야 하는 경우, AI 통제 유스 케이스에 설명된 대로 모델 추적을 시작하십시오.

각 유스 케이스를 탐색하여 수행할 수 있는 작업과 사용할 수 있는 도구에 대해 학습합니다.

데이터 거버넌스

비즈니스 지식을 제공하고 데이터 보호를 정의하는 메타데이터를 기반으로 거버넌스를 구현합니다. 셀프 서비스 카탈로그에 고품질 데이터 자산을 제공합니다. 규제 준수를 위한 데이터 거버넌스의 적용을 자동화합니다.

이 유스 케이스의 서비스: Watson Knowledge Catalog 및 IBM Match 360 with Watson.

데이터 통제 유스 케이스를 참조하십시오.

데이터 통합

이동하지 않고 모든 데이터에 대한 액세스를 단순화하고 자동화합니다. 분산된 환경에서 데이터를 조정하여 데이터 소비자에게 즉시 사용 가능한 정보의 네트워크를 생성합니다.

이 유스 케이스의 서비스: Watson Query, DataStage및 Watson Knowledge Catalog.

데이터 통합 유스 케이스를 참조하십시오.

데이터 사이언스 및 MLOps

데이터, 빌드, 배치, 모니터 및 모델을 준비하는 자동화된 워크플로우로 데이터 분석 및 모델 작성을 수행합니다.

이 유스 케이스의 서비스: Watson Studio, Watson Machine Learning, Watson OpenScale및 Watson Knowledge Catalog.

데이터 과학 및 MLOps 유스 케이스를 참조하십시오.

AI 거버넌스

모델에서 공정성, 품질 및 설명을 강제하는 자동화된 워크플로우를 사용하여 AI 통제를 운영합니다.

이 유스 케이스의 서비스: Watson Studio, Watson Machine Learning, Watson OpenScale및 Watson Knowledge Catalog.

AI 통제 유스 케이스를 참조하십시오.

자세히 보기