環境を構成することにより、 DataStage ジョブがランタイム・エンジン上でどのように実行されるかを制御します。 IBM Cloud 上の環境で DataStage ジョブを実行することも、独自の DataStage リモート・ランタイム・エンジンを使用する環境をセットアップしてジョブをローカルで実行することもできます。
IBM Cloud 上の DataStage 環境
IBM® DataStage® は、ジョブの実行に使用できる 3 つの PX 環境を提供します。 ジョブはデフォルトで Default DataStage PX S runtime を使用します。 ただし、フローをジョブとして実行する前に、使用可能な 3 つの環境のいずれかに環境を更新できます。
IBM Cloud の 3 つのランタイムは、追跡されるキャパシティー・ユニット時間 (CUH) を消費します。 ジョブの実行にかかる時間のみが追跡されます。 DataStage キャンバス上のフローの作成、構成、および更新では、CUH は使用されません。
DataStage フローを実行するジョブを作成するときに、以下のいずれかの事前設定環境を選択できます。
名前 | ハードウェア構成 |
---|---|
Default DataStage PX S |
1 コンダクター: 2 vCPU および 8 GB RAM |
Default DataStage PX M |
1 コンダクター: 4 vCPU および 16 GB RAM |
Default DataStage PX L |
1 コンダクター: 8 vCPU および 32 GB RAM |
デフォルトのDataStagePX Sランタイムは、別の環境を選択しない限り、DataStageでデータを抽出、変換、およびロードするジョブを実行するときに使用されます。 大規模なデータ・セットを使用する複雑なジョブの場合は、容量を増やすために、より多くの vCPU とメモリーを使用するプランを選択します。 デフォルト環境では、2 つのパーティションが使用されます。
使用する環境を更新するには、以下のようにします:
- DataStage キャンバスで、実行設定アイコンを選択し、使用する環境を選択します。
- ジョブを選択し、ジョブ構成を編集し、「実行設定」タブで環境を変更します。
管理者は、 IBM Cloud 用の新しい環境を作成して、環境変数を指定し、パーティションの数を変更することができます。
リモート・ランタイム・エンジン上の DataStage 環境
リモート・ランタイム・エンジンを使用して、 IBM によって管理されていない環境でジョブを実行できます。 DataStage リモート・ランタイム・エンジンでは、オンプレミスのアプリケーションとデータベースを使用して、ジョブをローカルで実行できます。 管理者は、プロジェクト・レベルで DataStage リモート・ランタイム・エンジンを構成できます。 DataStage リモート・ランタイム・エンジンを使用するプロジェクトへの編集者権限または管理者権限を持つ開発者は、その環境でジョブを実行できます。
リモート環境をプロジェクトのデフォルト環境として選択すると、そのプロジェクトで使用できるのはリモート環境のみになります。 そのプロジェクトの DataStage ジョブに対して IBM Cloud 環境の使用に戻すことはできません。
- ワークロードとプロセス・データをローカルで実行
- データ転送コストの回避
- クラウド環境に対してデータをローカルに保持することでセキュリティーを強化
- 完全な Cloud Pak for Data インストール済み環境を維持することなく、ユーザー定義ステージ、Java Integration ステージ、Before/after ジョブ・ルーチンなど、 Cloud Pak for Data の DataStage 機能を使用します。
リモート環境では、ドライバー・アップロード、ボールト、およびデータ・サービス・コネクターを必要とするコネクターはサポートされません。 いくつかのコネクターは、フロー接続を介してのみサポートされます。
詳細については、DataStageAnywhereを参照してください。
フローの実行
以下のようにして、 DataStage フローを実行するジョブを作成できます。
- DataStage キャンバスで、 DataStage ツールバーから「実行」アイコンをクリックして直接表示します (フローを実行するジョブのデフォルト名は、フローの名前に .DataStage job を付加したものです)。
- プロジェクトの 「DataStage フロー 」ページで、 DataStage フローを選択し、「アクション」メニューをクリックして 「新規ジョブ」を選択します。
DataStageでデータを抽出、変換、またはロードするジョブを実行すると、「Default DataStage XS runtime
」が自動的に開始され、プロジェクトの「Environments」ページにアクティブなランタイムとして表示されます。 使用する環境を更新するには、 DataStage キャンバスで「実行設定」アイコンを選択するか、 「ジョブ」 タブからジョブを選択して設定を変更します。
月次請求のモニター
リソース使用量情報を確認するには、IBM Cloud アカウント所有者または管理者でなければなりません。
月額料金、使用された CUH の量、使用された VPC の数、およびサービス・インスタンスのユーザー数を確認するには、クラウド使用状況ダッシュボードに移動します。 インスタンスごとに、「管理」>「請求および使用量」>「使用量」をクリックし、サービス名の横にある インスタンスの表示 をクリックしてから、インスタンス名の横にある インスタンスの表示 をクリックします。
ジョブのランタイム・ログ
DataStage ジョブの累積ログを表示するには、以下のようにします。
- プロジェクトの 「ジョブ」 ページで、ログを表示する DataStage ジョブをクリックします。
- ジョブ実行をクリックします。 ジョブ・ログを表示したり、ログをクリップボードにコピーしたり、ログをダウンロードしたりすることができます。