DataStage® フローは、データ統合ロジックを含む設計時の資産です。
空の DataStage フローを作成して、それにコネクターとステージを追加することも、ISX ファイルまたは ZIP ファイルから既存の DataStage フローをインポートすることもできます。
- データを読み取るデータ・ソース
- データを変換するステージ
- データを書き込むデータ・ターゲット
- ソース、ステージ、およびターゲットを接続するリンク
DataStage フローとそれに関連するオブジェクトは、プロジェクトに編成されます。 開始するには、既存のプロジェクトを開くか、新規プロジェクトを作成します。
DataStage フローの作成
DataStage フローを作成するには、以下のステップを実行します。
- 既存のプロジェクトまたは「プロジェクトの作成」を開きます。
- 資産タブで、 をクリックする。
- 「 DataStage フローの作成」 ページで、以下の 2 つの方法のいずれかを使用して、 DataStage フローを作成します。
- 「新規」 タブをクリックし、 DataStage フローに必要な詳細を追加して、 「作成」をクリックします。 新しい DataStage フローが開き、 DataStage デザイナー・キャンバス上にオブジェクトが表示されません。
- 「ローカル・ファイル」 タブをクリックし、ローカル・コンピューターから ISX ファイルまたは ZIP ファイルをアップロードします。 次に「作成」をクリックします。 インポート・プロセスが完了したら、インポート・レポート・ページを閉じ、プロジェクトの 「資産」 タブからインポートした DataStage フローを開きます。
- コネクターまたはステージをパレットから DataStage デザイン・キャンバスにノードとしてドラッグし、必要に応じて配置します。 これらのノードをキャンバス上で接続するには、ポインターをノード上に移動して矢印をノード上に表示させ、矢印アイコンをクリックして、接続先のノードまでドラッグします。
このアクションは、ノード間のリンクを作成します。
リモート・データに接続するには、DataStageのデータ・ソースへの接続を参照してください。
- ノードをダブルクリックすると、そのプロパティー・パネルが開きます。このパネルで、ノードの構成と設定を指定できます。
- フローのセットアップが完了したら、「実行」をクリックします。
フローは自動的に保存、コンパイル、および実行されます。 コンパイルとジョブの両方の実行のログを表示することができます。
DataStage フローの編集
以下のアクションを使用して、 DataStage フローを編集できます。
- ステージまたはコネクターをドラッグし、既に DataStage デザイン・キャンバス上にある 2 つのノード間のリンクにドロップします。 新規ノードおよび列のリンクは自動的に追加され、自動的に伝搬されます。 結果を表示するには、もう一度 「実行」 をクリックします。
- DataStage キャンバス上のノードの上にポインターを移動し、リンクの終点をクリックすることで、ノードからリンクを手動で切り離し、再接続します。
- ステージまたはコネクターをパレットからドラッグし、キャンバス上に既にあるリンクにドロップします。 ステージまたはコネクターは、その両側のノードに自動的にリンクされ、 DataStage フローの列は自動的に伝搬されます。
- 置き換えアイコンをクリックし、フローを置き換える別のフローを選択します。 このアクションは、Build、Custom、Wrappedステージのほか、サブフローやJavaライブラリでも使用できます。
データのプレビュー
DataStageフロー内のデータを編集してプレビューできます。 キャンバス上で接続を右クリックし、[Preview Data]を選択する。 すべての接続とファイルコネクタでデータをプレビューできます。 ファイル・コネクタの詳細については、 DataStageのファイル・コネクタを参照してください。
例えば、タイムゾーンで時刻やマイクロ秒をプレビューすることができます。 time
と'microseconds time
データ型はどちらも標準フォーマットで表示される: HH:mm:ss
」は時刻を表し、「HH:mm:ss.SSSSSS
」はマイクロ秒を表す。
Input time: 00:00:01-10:00
Local Time: 00:00:01
offset: -10 (which means UTC is 10 hours ahead of local time)
UTC Time: LocalTime + Offset = 00:00:01 + 10 hrs = 10:00:01
ここで、タイムゾーンは変換され、標準的な時間フォーマットの「10:00:01
」として表示される。考慮事項
- 機密情報および暗号化されたプロパティー値
- DataStage フローでのパスワードなどの暗号化されたプロパティー値の指定は推奨されません。 代わりに、名前付きパラメーターを使用してタイプ Encrypted のパラメーター・セットを作成し、パラメーターのデフォルト値を指定しないでください。 フロー内で、暗号化されたパラメーター・セットを参照し、プロパティー値に指定されたパラメーターを指定します (例:
#<parameter set>.<parameter name>#
)。 フローを実行しているジョブ内のパラメーター#parameter set.parameter name#
の暗号化された値を指定します。 - データ破損を回避するためのソースおよびターゲット内のファイルの命名
- ほとんどの場合、ソースとターゲットが同じデータベースまたはストレージ・システムを指している場合は、ソースとターゲットで同じファイル名を使用しないでください。 この規則は、ファイルおよびデータベース表に適用されます。 名前が同じ場合、データが破損する可能性があります。
- 列メタデータ変更伝搬
- 列のメタデータを変更すると、その変更は自動的にダウンストリームに伝搬されます。 一度メタデータを変更すると、上流で行われた変更は列に適用されません。 列を削除した場合、後のステージで列を変更しても、その列は再び追加されません。
- ランタイム列伝搬
- RCP が設定されている場合、ジョブの実行時にメタデータに定義されていない追加の列が検出されると、それらの追加の列が採用され、ジョブの残りの部分に伝搬されます。 これにより、マッピングの欠落によるエラーが回避されます。
- パラメーターの追加
- パラメーターの追加を参照してください。
もっと見る
例
- DataStage フローの作成
単純な DataStage フローを作成する方法の例については、次のビデオをご覧ください。
このビデオは、この資料の概念とタスクを学習するための視覚的な方法を提供します。
- プロジェクトへの DataStage フローのインポート
DataStage フローをプロジェクトにインポートする方法の例については、以下のビデオをご覧ください。
このビデオは、この資料の概念とタスクを学習するための視覚的な方法を提供します。