DataStage on Cloud Pak for Data as a Service

 

説明

IBM DataStage は、データの移動と変換を行うジョブを設計、開発、実行するためのデータ統合ツールです。

DataStage は、 Cloud Pak for Dataのデータ統合コンポーネントの 1 つです。 DataStage サービスは、データ・ファブリックの一部として Cloud Pak for Data as a Service に完全に統合されています。 ソース・システムからターゲット・システムにデータを移動するジョブを開発するためのグラフィカル・フレームワークを提供します。 変換されたデータは、データウェアハウス、データマート、オペレーショナル・データ・ストア、リアルタイム Web サービスとメッセージング・システム、およびその他のエンタープライズ・アプリケーションに送信できます。 DataStage は、抽出、変換、およびロード (ETL) パターンと、抽出、ロード、および変換 (ELT) パターンをサポートします。 DataStage は、並列処理とエンタープライズ接続を使用して、真にスケーラブルなプラットフォームを提供します。

DataStage は、 Cloud Pak for Data as a Service の一部であり、データ・ファブリック・アーキテクチャーのデータ統合機能を提供します。

DataStage が Cloud Pak for Data as a Serviceのサービス・アーキテクチャーにどのように適合するかを示す図。

DataStage パラレル・エンジン (PX) リモート・ランタイム as-a-service を使用すると、 IBM Cloud および IBMによって管理される事前作成リモート・ロケーションでジョブを実行できます。 リモート・ロケーションを環境として使用することで、他のパブリック・クラウドからデータを移動またはコピーする必要性を完全にまたは部分的になくすことができます。 ワークロードをデータの場所に移動することで、パフォーマンスを向上させ、データの常駐要件を満たし、データ転送コストを削減できます。

DataStage を使用すると、企業は以下の目標を達成できます。

  • 複数のソース・システムから情報を取り出し、必要に応じてデータを変換し、ターゲット・データベースまたはアプリケーションにデータを送信するデータ・フローを設計します。
  • ソースまたはターゲットとしてエンタープライズ・アプリケーションに直接接続して、データが適切、完全、かつ正確であることを確実にします。
  • あらかじめ作成された機能を使用することで、開発時間を短縮し、設計とデプロイメントの一貫性を向上させます。
  • Watson Studio 全体で共通のツール・セットを使用して作業することにより、プロジェクトのデリバリー・サイクルを最小化します。

このサービスは、プロジェクトにツールを追加します。

クイック・リンク

統合サービス

表 1. 関連サービス以下の関連サービスは、多くの場合、このサービスと一緒に使用され、補完機能を提供しますが、必須ではありません。
サービス 機能
Watson™ Knowledge Catalog データ・ガバナンス・フレームワークによってサポートされる、このセキュアなエンタープライズ・カタログ管理プラットフォームを使用して、キュレートされた資産のカタログを作成します。
Watson Studio データ・サイエンティスト、開発者、および対象分野の専門家向けのツールを使用して、コラボレーション環境でデータを準備、分析、およびモデル化します。