서비스로 데이터용 클라우드 팩에서 DataStage

설명

IBM DataStage는 데이터를 이동하고 변환하는 작업을 설계, 개발 및 실행하기 위한 데이터 통합 도구입니다.

DataStage는 Watson Studio의 데이터 통합 구성요소 중 하나입니다. DataStage 서비스는 데이터 패브릭의 일부로 Cloud Pak for Data as a Service에 완전히 통합됩니다. 이는 데이터를 소스 시스템에서 대상 시스템으로 이동하는 작업을 개발하기 위한 그래픽 프레임워크를 제공합니다. 변환된 데이터는 데이터 웨어하우스, 데이터 마트 및 운영 데이터 스토어, 실시간 웹 서비스 및 메시징 시스템 및 기타 엔터프라이즈 애플리케이션에 전달될 수 있습니다. DataStage는 추출, 변환과 로드(ETL) 및 추출, 로드 및 변환(ELT) 패턴을 지원합니다. DataStage는 병렬 처리 및 엔터프라이즈 연결을 사용하여 완전히 확장 가능한 플랫폼을 제공합니다.

DataStage 병렬 엔진(PX) 원격 서비스형 런타임을 통해, IBM Cloud 및 IBM이 관리하는 사전 빌드된 Satellite 위치에서 작업을 실행할 수 있습니다. Satellite 위치를 환경으로 사용해서, 다른 퍼블릭 클라우드로부터 데이터를 이동하거나 복사해야 하는 필요성을 완전히 또는 부분적으로 제거할 수 있습니다. 워크로드를 데이터의 위치로 가져옴으로써 성능을 개선하고, 데이터 상주 요구사항을 충족하며, 데이터 전송 비용을 낮출 수 있습니다.

DataStage를 통해 회사는 다음 목표를 달성할 수 있습니다.

  • 정보를 여러 소스 시스템에서 추출하는 데이터 플로우를 설계하고, 데이터를 필요에 따라 변환하고 데이터를 대상 데이터베이스 또는 애플리케이션으로 전달합니다.
  • 데이터가 관련되고, 완전하고, 정확한지 확인하기 위해 엔터프라이즈 애플리케이션에 소스 또는 대상으로서 직접 연결합니다.
  • 미리 빌드된 함수를 사용하여 개별 시간을 줄이고 디자인과 배치의 일관성을 높입니다.
  • 전체 Watson Studio에서 공통 도구 세트로 작업하여 프로젝트 전달 주기를 최소화합니다.

이 서비스는 프로젝트에 도구를 추가합니다.

빠른 링크

통합 서비스

표 1. 관련 서비스
Service 기능
Watson™ KnowledgeCatalog 데이터 거버넌스 프레임워크에서 지원하는 이 보안 엔터프라이즈 카탈로그 관리 플랫폼을 사용하여 큐레이션된 자산의 카탈로그를 작성합니다.
Watson Studio 데이터 과학자, 개발자 및 도메인 전문가용 도구를 사용하여 협업 환경에서 데이터를 준비, 분석 및 모델링합니다.