0 / 0
영어 버전 문서로 돌아가기
Cloud Pak for Data as a Service 개요

Cloud Pak for Data as a Service 개요

Cloud Pak for Data as a Service는 모든 데이터 거버넌스, 데이터 엔지니어링, 데이터 분석 및 AI 라이프사이클 태스크를 위한 클라우드 서비스 플랫폼입니다. Cloud Pak for Data as a Service는 데이터 패브릭 솔루션을 구현하므로 조직에 신뢰할 수 있는 데이터에 즉각적이고 안전한 액세스를 제공하고 프로세스 및 준수를 자동화하며 애플리케이션에서 신뢰할 수 있는 AI를 제공할 수 있습니다.

Cloud Pak for Data as a Service는 다음 이점으로 완전히 관리되는 클라우드 서비스 플랫폼입니다.

  • 소프트웨어 또는 하드웨어의 설치, 관리 또는 업데이트가 없음
  • 확장 또는 축소가 간단
  • 안전하고 규제를 준수
  • 구성 가능한 서비스 아키텍처
  • 구독 또는 소비 기반 월별 요금 청구

Cloud Pak for Data as a Service 의 개요를 보려면 이 비디오를 보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.


Cloud Pak for Data as a Service 데이터 패브릭 솔루션

데이터 패브릭 아키텍처를 통해 기업은 하이브리드 멀티클라우드 데이터 환경에서 데이터의 가치를 잠금 해제할 수 있습니다. 데이터 패브릭 아키텍처로 이동하면 엔터프라이즈가 분석, 데이터 과학, 고객 마스터 데이터 및 규정 준수를 위해 데이터를 통합, 관리 및 사용하는 방법을 변환합니다.

데이터 패브릭을 사용하면 서로 다른 소스의 데이터에 액세스하는 안전하고 일관된 방법을 사용할 수 있습니다. 비효율적이고 반복적이며 수동적인 데이터 액세스 및 통합 프로세스를 제거할 수 있습니다. 데이터 패브릭 아키텍처는 소스 간의 갭을 연결하고 회사의 요구사항을 지원하기 위해 비즈니스 준비 데이터를 제공합니다. 하이브리드 및 멀티 클라우드 환경에서 다양한 유형의 소스의 데이터에 대해 작업할 수 있으며, 통합된 데이터 관리 기능을 통해 데이터를 안전하고 신뢰할 수 있게 유지할 수 있습니다.

다양한 데이터 소스가 있는 데이터 패브릭을 표시하는 이미지

데이터 엔지니어는 데이터를 준비, 변환 및 가상화하는 도구가 필요합니다. 데이터 품질 분석가는 데이터의 품질을 측정하기 위한 도구가 필요합니다. 통제 팀에는 데이터를 제어하고 보호하며 강화하기 위한 도구가 필요합니다. 비즈니스 분석가 및 데이터 과학자와 같은 데이터 이용자는 협업적으로 인사이트 및 모델을 개발하는 도구가 필요합니다. 통합 도구의 Cloud Pak for Data 플랫폼을 사용하면 조직에서 효율적으로 함께 작업하여 데이터를 사용하여 비즈니스를 개선할 수 있습니다.

데이터 패브릭 아키텍처는 기계 학습을 사용하여 메타데이터 처리를 자동화하는 활성 메타데이터 관리를 구현합니다. 메타데이터 분석의 결과는 자동화된 데이터 검색을 용이하게 하고, 데이터에 대한 신뢰도를 높이며, 규모에 따라 데이터 보호 및 데이터 통제 있 시작다 있다십시오.

데이터 패브릭 솔루션에 대한 자세한 정보는 유스 케이스를 참조하십시오. 데이터 패브릭 구현을 경험하려면 데이터 패브릭 학습서를 참조하십시오.

서비스 및 플랫폼 아키텍처

서비스를 프로비저닝하여 Cloud Pak for Data as a Service 플랫폼에 기능과 도구를 추가합니다. 코어 서비스 세트가 공통 플랫폼에 통합됩니다. 다른 연관된 서비스는 플랫폼에 대해 작업하지만 외부에서 실행됩니다. Cloud Pak for Data as a Service에 등록하는 방법에 따라 단일 데이터 패브릭 솔루션 유스 케이스를 나타내는 코어 서비스의 서브세트로 시작할 수 있습니다.

서비스 아키텍처

Cloud Pak for Data as a Service 서비스 카탈로그에서 이러한 유형의 서비스를 프로비저닝할 수 있습니다.

  • 코어 서비스
    코어 서비스는 완벽하게 통합되며 도구, 작업공간 또는 컴퓨팅 기능을 플랫폼 UI에 추가합니다.

    • 데이터 분석을 위한 Watson Studio
    • 모델 빌드 및 배치를 위한 Watson Machine Learning
    • 모델 평가를 위한 Watson OpenScale
    • 데이터 및 기타 자산을 통제하고 카탈로그화하기 위한 IBM Knowledge Catalog
    • 데이터 통합을 위한 DataStage
    • 데이터 가상화 및 조회를 위한 Data Virtualization
    • 마스터 데이터를 작성하기 위한 Match 360
    • 데이터 복제를 위한 Data Replication
    • 데이터 시각화를 위한 Cognos Dashboard Embedded
  • 연관된 서비스
    플랫폼 내에서 데이터에 액세스하지만 플랫폼 외부에서 데이터를 저장하고 관리하는 데 사용할 수 있는 IBM Cloud 데이터베이스 서비스입니다.

    자체 UI가 있거나 데이터 분석을 위한 API를 제공하는 Watson 서비스입니다.

작업공간 및 자산

Cloud Pak for Data as a Service 는 팀 또는 조직과 함께 작업할 수 있는 협업 작업 영역 세트로 구성됩니다. 각 작업공간에는 조치를 수행할 수 있는 권한을 제공하는 역할이 있는 구성원 세트가 있습니다. 대부분의 사용자는 플랫폼에 추가되는 항목인 자산에 대해 작업합니다. 데이터 자산에는 데이터를 나타내는 메타데이터가 포함되어 있으며, 데이터 파이프라인 및 모델과 같은 도구에서 작성하는 자산은 데이터에 대해 작업하기 위해 코드를 실행합니다. 다음 다이어그램은 기본 작업공간, 해당 용도 및 자산 및 기타 항목이 플랫폼에서 이동하는 방법을 보여줍니다.

기본 작업공간은 프로젝트, 카탈로그, 배치 영역 및 카테고리입니다. 자산은 프로젝트와 배치 공간 및 카탈로그 간에 이동합니다. 통제 아티팩트는 카테고리에서 작성되며 카탈로그의 자산에 메타데이터로 추가됩니다.

프로젝트

프로젝트는 데이터 과학, 데이터 엔지니어링 또는 데이터 큐레이션 팀이 데이터와 함께 작업하여 자산(예: 노트북, 대시보드, 모델, 데이터 파이프라인 또는 보강된 데이터 자산)을 작성하는 위치입니다. 프로젝트 도구는 대부분의 코어 서비스에 의해 제공됩니다.

  • Watson Studio는 Data Refinery, Jupyter 노트북 편집기, SPSS Modeler, Decision Optimization, Pipelines 및 RStudio 도구를 제공합니다.
  • Watson Machine Learning는 AutoAI 및 Federated Learning 도구를 제공합니다.
  • IBM Knowledge Catalog 는 Data Refinery, Metadata import, 메타데이터 강화 및 마스킹 플로우 도구를 제공합니다.
  • DataStage는 DataStage 데이터 파이프라인 편집기를 제공합니다.
  • Cognos Dashboard Embedded는 대시보드 편집기를 제공합니다.
  • Data Replication 는 Data Replication 도구를 제공합니다.
  • Match 360은 마스터 데이터 구성 도구를 제공합니다.

다음 이미지는 프로젝트의 개요 페이지가 표시되는 모양을 보여줍니다.

프로젝트에는 자산 및 협업자가 포함되어 있습니다.

카탈로그

카탈로그는 조직에서 고품질의 신뢰할 수 있는 데이터 및 기타 자산(예: 모델 팩트시트)을 찾고 저장하는 위치입니다. 카탈로그에서 데이터 자산을 찾아 프로젝트로 이동하여 데이터에 대해 작업할 수 있습니다. 또는 프로젝트의 데이터를 축소하고 고품질의 데이터 자산을 다른 사용자가 사용할 수 있도록 카탈로그에 게시할 수 있습니다. 카탈로그에는 IBM Knowledge Catalog 서비스가 필요합니다.

다음 이미지는 카탈로그의 자산 페이지가 표시되는 내용을 보여줍니다.

카탈로그에는 자산의 보기가 포함되어 있습니다.

배치 공간

배치 영역은 ModelOps 팀이 모델 및 기타 배치 가능한 자산을 프로덕션에 배치한 후 프로덕션에서 배치를 테스트하고 관리하는 위치입니다. 프로젝트에서 모델 및 배치 가능한 자산을 빌드한 후에는 이를 배치 영역으로 승격시킵니다.

다음 이미지는 배치 공간의 개요 페이지가 어떻게 표시되는지 보여줍니다.

배치 영역에는 자산 및 협업자가 포함되어 있습니다.

카테고리(G)

범주는 관리 팀이 카탈로그에서 데이터 자산을 보강하는 거버넌스 아티팩트를 작성하고 관리하는 곳입니다. 카테고리에는 IBM Knowledge Catalog 서비스가 필요합니다.

다음 이미지는 범주의 모양을 보여줍니다.

카테고리에는 통제 아티팩트가 포함되어 있습니다.

기타 작업 공간

다른 작업공간에서 특수화된 데이터 자산을 작성하고 이를 프로젝트 및 카탈로그로 이동할 수 있습니다.

  • Data Virtualization 서비스는 여러 데이터 소스에서 데이터 자산을 가상화하는 작업공간을 제공합니다.
  • Match360 서비스는 고객 데이터의 360도 보기를 구성하고 탐색할 수 있는 작업 공간을 제공합니다.

자원 허브

플랫폼에는 샘플 데이터 자산, 노트북 및 프로젝트를 제공하는 통합 자원 허브가 포함되어 있습니다. 샘플 노트북은 데이터 과학 및 머신 러닝 코드의 예제를 제공합니다. 산업 액셀러레이터를 포함한 샘플 프로젝트에는 특정 비즈니스 문제점을 해결하는 방법에 대한 자세한 지시사항 및 데이터, 모델, 기타 자산 세트가 들어 있습니다. 자원 허브는 특정 산업에 대한 비즈니스 어휘를 제공하기 위해 가져올 수 있는 통제 아티팩트 세트를 포함하는 Knowledge Accelerators도 제공합니다.

다음 이미지는 자원 허브의 모양을 보여줍니다.

자원 허브에는 샘플이 포함되어 있습니다.

자원 허브의 둘러보기를 보려면 이 비디오를 보십시오.

이 비디오는 이 문서의 개념 및 태스크를 학습하기 위한 시각적 방법을 제공합니다.

자세한 정보

상위 주제: Cloud Pak for Data as a Service

일반적인 AI 검색 및 응답
이러한 응답은 제품 문서의 컨텐츠를 기반으로 하는 watsonx.ai 의 대형 언어 모델에 의해 생성됩니다. 자세히 알아보기