DataStage on Cloud Pak for Data as a Service

 

설명

IBM DataStage는 데이터를 이동하고 변환하는 작업을 설계, 개발 및 실행하기 위한 데이터 통합 도구입니다.

DataStage Cloud Pak for Data의 데이터 통합 컴포넌트 중 하나입니다. DataStage 서비스는 데이터 패브릭의 일부로 Cloud Pak for Data as a Service에 완전히 통합됩니다. 이는 데이터를 소스 시스템에서 대상 시스템으로 이동하는 작업을 개발하기 위한 그래픽 프레임워크를 제공합니다. 변환된 데이터는 데이터 웨어하우스, 데이터 마트 및 운영 데이터 스토어, 실시간 웹 서비스 및 메시징 시스템 및 기타 엔터프라이즈 애플리케이션에 전달될 수 있습니다. DataStage는 추출, 변환과 로드(ETL) 및 추출, 로드 및 변환(ELT) 패턴을 지원합니다. DataStage는 병렬 처리 및 엔터프라이즈 연결을 사용하여 완전히 확장 가능한 플랫폼을 제공합니다.

DataStage Cloud Pak for Data as a Service 의 일부이며 데이터 패브릭 아키텍처의 데이터 통합 기능을 제공합니다.

DataStage 가 Cloud Pak for Data as a Service의 서비스 아키텍처에 맞는 방식을 설명하는 다이어그램입니다.

DataStage 병렬 엔진 (PX) 원격 런타임을 서비스로 사용하면 IBM Cloud 에서 작업을 실행하고 IBM에서 관리하는 사전 빌드된 원격 위치에서 작업을 실행할 수 있습니다. 원격 위치를 사용자 환경으로 사용하면 다른 공용 클라우드에서 데이터를 이동하거나 복사해야 하는 필요성을 완전히 또는 부분적으로 제거할 수 있습니다. 워크로드를 데이터의 위치로 가져옴으로써 성능을 개선하고, 데이터 상주 요구사항을 충족하며, 데이터 전송 비용을 낮출 수 있습니다.

DataStage를 통해 회사는 다음 목표를 달성할 수 있습니다.

  • 정보를 여러 소스 시스템에서 추출하는 데이터 플로우를 설계하고, 데이터를 필요에 따라 변환하고 데이터를 대상 데이터베이스 또는 애플리케이션으로 전달합니다.
  • 데이터가 관련되고, 완전하고, 정확한지 확인하기 위해 엔터프라이즈 애플리케이션에 소스 또는 대상으로서 직접 연결합니다.
  • 미리 빌드된 함수를 사용하여 개별 시간을 줄이고 디자인과 배치의 일관성을 높입니다.
  • 전체 Watson Studio에서 공통 도구 세트로 작업하여 프로젝트 전달 주기를 최소화합니다.

이 서비스는 프로젝트에 도구를 추가합니다.

빠른 링크

통합 서비스

표 1. 관련 서비스. 다음 관련 서비스는 종종 이 서비스와 함께 사용되며 보완 기능을 제공하지만 필요하지 않습니다.
서비스 기능
Watson™ Knowledge Catalog 데이터 거버넌스 프레임워크에서 지원하는 이 보안 엔터프라이즈 카탈로그 관리 플랫폼을 사용하여 큐레이션된 자산의 카탈로그를 작성합니다.
Watson Studio 데이터 과학자, 개발자 및 도메인 전문가용 도구를 사용하여 협업 환경에서 데이터를 준비, 분석 및 모델링합니다.