資料の 英語版 に戻るDataStage ステージ
DataStage ステージ
最終更新: 2024年12月09日
DataStage® フローは、データ・ソースからデータ・ターゲットへのデータのフローを記述する、相互にリンクされたステージで構成されます。 ステージは、データ・ソース、処理ステップ、またはターゲット・システムを説明します。 また、ステージは、入力リンクから出力リンクにデータを移動する処理ロジックも定義します。
ステージ関数
ステージには通常、少なくとも 1 つのデータ入力または 1 つのデータ出力があります。 ただし、いくつかのステージでは、複数のデータ入力を受け入れることができ、複数のステージに出力することができます。 以下の表に、使用可能なステージとその機能の詳細を示します。
ステージ | アイコン | 関数 |
---|---|---|
Aggregator | 着信データをグループに分類し、グループごとに合計およびその他の要約機能を計算し、それらをジョブ内の別のステージに渡します。 | |
Bloom Filter | 前の値に対して受信鍵を検索します。 | |
Change Apply | 変更されたデータ・セットに基づいて、エンコードされた変更操作を前のデータ・セットに適用します。 Change Capture ステージからのデータ・セットの前後。 | |
Change Capture | 2 つのデータ・セットを比較して、相違点のレコードを作成します。 | |
Checksum | 行内の指定された列から checksum 値を生成し、その行に checksum を追加します。 | |
Column Export | さまざまなデータ・タイプの複数の列から、データ・タイプustring、string、またはbinaryの単一列にデータをエクスポートします。 | |
Column Generator | 列を受信データに追加し、処理されるデータ行ごとにこれらの列の模擬データを生成します。 | |
Column Import | 1 つの列からデータをインポートし、1 つ以上の列に出力します。 | |
Combine Records | 特定のキー列の値が同一であるレコードを、サブレコードのベクトルに結合します。 | |
Compare | 事前にソートされた 2 つの入力データ・セット内の、レコードの列ごとの比較を実行します。 | |
Compress | UNIX compress または GZIP ユーティリティーを使用して、データ・セットを圧縮します。 データ・セットは一連のレコードからロー・バイナリー・データのストリームに変換されます。 | |
Copy | 単一の入力データ・セットを複数の出力データ・セットにコピーします。 | |
Decode | 指定した UNIX デコード・コマンドを使用してデータ・セットをデコードします。 | |
Difference | 2 つの入力データ・セット(同じデータ・セットの異なるバージョン) をレコード単位で比較します。 | |
Distributed Transaction | 複数のデータ・ソースにわたってトランザクションを実行します。 | |
Encode | 指定した UNIX エンコード・コマンドを使用してデータ・セットをエンコードします。 | |
Expand | UNIX の uncompress または GZIP ユーティリティーを使用して、データ・セットを解凍します。 以前に圧縮されたデータ・セットを変換して、ロー・バイナリー・データのストリームから一連のレコードに戻します。 | |
External Filter | 処理中のデータに対してフィルターとして機能する UNIX コマンドを指定できます。 | |
Filter | 指定した要件を満たす入力データ・セットのレコードを変更せずに転送し、他のすべてのレコードをフィルターで除外します。 | |
Funnel | 複数の入力データ・セットを 1 つの出力データ・セットにコピーします。 | |
Generic | ジョブに Orchestrate ® Operator を取り込みます。 | |
Head | 入力データ・セットの各パーティションから最初の N レコードを選択し、選択したレコードを出力データ・セットにコピーします。 | |
Join | 2 つ以上のデータ・セットへの結合操作を実行し、ステージに入力された後、結果のデータ・セットを出力します。 | |
Lookup | データを出力する他のパラレル・ジョブ・ステージからメモリーに読み込まれるデータ・セット、または参照出力リンクをサポートするデータベース・ステージの 1 つで提供されるデータ・セットに、ルックアップ操作を実行するために使用します。 Lookup File Setステージに含まれるルックアップ・テーブルに対してルックアップを実行することもできます。 | |
Make Subrecords | 入力データ・セット内の指定されたベクトルを、サブレコードのベクトルに結合します。サブレコードの各列には、元のベクトルの名前とデータ・タイプが設定されます。 | |
Make Vector | 入力データ・レコードの指定された列を結合して、列のベクトルにします。 | |
Merge | ソートされたマスター・データ・セットを 1 つ以上のソート済み更新データ・セットと結合します。 | |
Modify | 入力データ・セットのレコード・スキーマを変更します。 | |
Peek | ステージが入力データ・セットから 1 つ以上の出力データ・セットにレコードをコピーするときに、レコード列の値をジョブ・ログまたは別の出力リンクに印刷します。 | |
Pivot Enterprise | Pivot Enterprise ステージは、データを水平方向および垂直方向にピボットする処理ステージです。 水平ピボットは、入力行内の列セットを複数の出力行の単一列にマップします。 垂直ピボットは、入力データ内の行セットを単一または複数の出力列にマップします。 |
|
Promote Subrecords | 入力サブレコードの列を、最上位レベルの列にプロモートします。 | |
Remove Duplicates | ソートされた単一のデータ・セットを入力として取得し、重複するレコードをすべて消去し、その結果を出力データ・セットに書き込みます。 | |
Row Generator | 指定されたメタデータに適合する模擬データのセットを作成します。 | |
Sample | 入力データ・セットをサンプリングします。 | |
Slowly Changing Dimension (SCD) | スター・スキーマ・データベースのコンテキスト内で作業して、時間の経過とともに現在のデータと履歴データを保管および管理します。 | |
Sort | 入力列をソートします。 | |
Split Subrecord | 入力サブレコード・フィールドを最上位ベクトル列のセットに分割します。 | |
Split Vector | 固定長ベクトルのエレメントを、同じ名前の最上位レベルの列のセットにプロモートします。 | |
Surrogate Key Generator stage | サロゲートキー列を生成し、キー・ソースを保守します。 | |
Switch | 1 つのデータ・セットを入力として受け取り、セレクター・フィールドの値に基づいて、各入力レコードを出力データ・セットに割り当てます。 | |
Tail | 入力データ・セットの各パーティションから最後の N レコードを選択し、選択したレコードを出力データ・セットにコピーします。 | |
Transformer | 抽出されたデータを処理し、必要な変換を実行し、データを別のアクティブなステージまたはターゲット・データベースまたはファイルに書き込むステージに渡します。 | |
Wave Generator | データのストリームをモニターし、必要に応じてウェーブ終了マーカーを挿入します。 | |
Web Service | DataStage フローまたはジョブ内の Web サービス操作にアクセスします。 | |
Write Range Map | 範囲マップにデータを書き込みます。 このステージには単一の入力リンクを設定できます。 |
この一連のビデオを視聴して、最も一般的なステージの使用方法を確認してください。