IBM® DataStage® は、プロジェクト内のデータを変換して統合するために使用できる ETL ツールです。
DataStage は、使いやすく設計されており、 Cloud Pak for Dataに完全に統合されています。 ISX ファイルを使用して既存のレガシーパラレル・ジョブを DataStage にインポートし、 DataStage 設計キャンバスを使用してフローを作成、編集、およびテストし、フローから生成されるジョブを実行することができます。 DataStage サービスは、 データ・ファブリックの一部です。
DataStage は、運用ターゲット・システム、トランザクション・ターゲット・システム、および分析ターゲット・システムの間でデータを移動および変換するデータ統合ツールです。 データ統合の専門家は、 DataStage を使用して、データを処理および変換するフローを開発します。 エンタープライズ・アプリケーション、クラウド・データ・ソース、リレーショナル・システムおよび NoSQL システム、REST エンドポイントなどに直接接続するために、何百もの事前構築された変換機能、並列処理機能、およびプラットフォーム接続が使用可能です。 これらのフローを管理、管理、デプロイ、および再利用して、組織全体の多数のシステム間でデータを統合できます。
- データ形式
- 表形式: Avro ファイル、CSV ファイル、JSON ファイル、Parquet ファイル、TSV (読み取り専用)ファイル、または区切り文字で区切られているテキスト・ファイル
- データ・サイズ
- 任意
- 必須サービス
- DataStage
- コネクター
- コネクターの例には、 Db2®、 Netezza® Performance Server、 Microsoft SQL Server、 Oracle、Teradata、 Snowflake、 Microsoft Azure File Storage、 Amazon Web Services 、 Google Cloud Platform サービス、および Amazon S3があります。
DataStage がサポートするコネクターのリストについては、 DataStage コネクター を参照してください。
- ステージ
- このサービスは、データベースへのアクセスや何らかの方法でのデータの変換など、特定のプロセスを記述するステージを提供します。 DataStage ステージは、データを移動および変換するための共通機能を提供します。 QualityStage ステージは、冗長データ、廃止データ、または不正確なデータの除去、データの標準化、およびアドレス・データの検証のために重要ですが、これらに限定されるものではありません。
DataStageがサポートするステージについては、DataStage ステージとDataStageの品質段階を参照してください。
詳細はDataStageの品質段階を参照。
もっと見る
DataStageのクイック スタート チュートリアルを確認するには、クイック スタート を参照してください:データを変換するをご覧ください。
データ・ファブリック・コンテキストにおける DataStage のチュートリアルを確認するには、 Multicloud data integration チュートリアル: データの統合を参照してください。
DataStageの使い方については、以下のトピックを参照してください: