0 / 0
資料の 英語版 に戻る
DataStage ステージ
最終更新: 2024年12月09日
DataStage ステージ

DataStage® フローは、データ・ソースからデータ・ターゲットへのデータのフローを記述する、相互にリンクされたステージで構成されます。 ステージは、データ・ソース、処理ステップ、またはターゲット・システムを説明します。 また、ステージは、入力リンクから出力リンクにデータを移動する処理ロジックも定義します。

ステージ関数

ステージには通常、少なくとも 1 つのデータ入力または 1 つのデータ出力があります。 ただし、いくつかのステージでは、複数のデータ入力を受け入れることができ、複数のステージに出力することができます。 以下の表に、使用可能なステージとその機能の詳細を示します。

表 1. ステージ
ステージ アイコン 関数
Aggregator アグリゲーター・アイコン 着信データをグループに分類し、グループごとに合計およびその他の要約機能を計算し、それらをジョブ内の別のステージに渡します。
Bloom Filter Bloom フィルター・アイコン 前の値に対して受信鍵を検索します。
Change Apply 「適用の変更」アイコン 変更されたデータ・セットに基づいて、エンコードされた変更操作を前のデータ・セットに適用します。 Change Capture ステージからのデータ・セットの前後。
Change Capture 「変更キャプチャー」アイコン 2 つのデータ・セットを比較して、相違点のレコードを作成します。
Checksum チェックサム・アイコン 行内の指定された列から checksum 値を生成し、その行に checksum を追加します。
Column Export チェックサム・アイコン さまざまなデータ・タイプの複数の列から、データ・タイプustringstring、またはbinaryの単一列にデータをエクスポートします。
Column Generator 列生成プログラム・アイコン 列を受信データに追加し、処理されるデータ行ごとにこれらの列の模擬データを生成します。
Column Import 「列のインポート」アイコン 1 つの列からデータをインポートし、1 つ以上の列に出力します。
Combine Records 「レコードの結合」アイコン 特定のキー列の値が同一であるレコードを、サブレコードのベクトルに結合します。
Compare 比較アイコン 事前にソートされた 2 つの入力データ・セット内の、レコードの列ごとの比較を実行します。
Compress 圧縮アイコン UNIX compress または GZIP ユーティリティーを使用して、データ・セットを圧縮します。 データ・セットは一連のレコードからロー・バイナリー・データのストリームに変換されます。
Copy 「コピー」アイコン 単一の入力データ・セットを複数の出力データ・セットにコピーします。
Decode デコード・アイコン 指定した UNIX デコード・コマンドを使用してデータ・セットをデコードします。
Difference 差分アイコン 2 つの入力データ・セット(同じデータ・セットの異なるバージョン) をレコード単位で比較します。
Distributed Transaction 分散トランザクション・アイコン 複数のデータ・ソースにわたってトランザクションを実行します。
Encode エンコード・アイコン 指定した UNIX エンコード・コマンドを使用してデータ・セットをエンコードします。
Expand 展開アイコン UNIX の uncompress または GZIP ユーティリティーを使用して、データ・セットを解凍します。 以前に圧縮されたデータ・セットを変換して、ロー・バイナリー・データのストリームから一連のレコードに戻します。
External Filter 外部フィルター・アイコン 処理中のデータに対してフィルターとして機能する UNIX コマンドを指定できます。
Filter フィルター・アイコン 指定した要件を満たす入力データ・セットのレコードを変更せずに転送し、他のすべてのレコードをフィルターで除外します。
Funnel ファネル・アイコン 複数の入力データ・セットを 1 つの出力データ・セットにコピーします。
Generic 汎用アイコン ジョブに Orchestrate ® Operator を取り込みます。
Head 「ヘッド」アイコン 入力データ・セットの各パーティションから最初の N レコードを選択し、選択したレコードを出力データ・セットにコピーします。
Join 「結合」アイコン 2 つ以上のデータ・セットへの結合操作を実行し、ステージに入力された後、結果のデータ・セットを出力します。
Lookup ルックアップ・アイコン データを出力する他のパラレル・ジョブ・ステージからメモリーに読み込まれるデータ・セット、または参照出力リンクをサポートするデータベース・ステージの 1 つで提供されるデータ・セットに、ルックアップ操作を実行するために使用します。 Lookup File Setステージに含まれるルックアップ・テーブルに対してルックアップを実行することもできます。
Make Subrecords アイコン 入力データ・セット内の指定されたベクトルを、サブレコードのベクトルに結合します。サブレコードの各列には、元のベクトルの名前とデータ・タイプが設定されます。
Make Vector 「ベクトルの作成」アイコン 入力データ・レコードの指定された列を結合して、列のベクトルにします。
Merge マージ・アイコン ソートされたマスター・データ・セットを 1 つ以上のソート済み更新データ・セットと結合します。
Modify 「変更」アイコン 入力データ・セットのレコード・スキーマを変更します。
Peek ピーク・アイコン ステージが入力データ・セットから 1 つ以上の出力データ・セットにレコードをコピーするときに、レコード列の値をジョブ・ログまたは別の出力リンクに印刷します。
Pivot Enterprise 「ピボット・エンタープライズ」アイコン

Pivot Enterprise ステージは、データを水平方向および垂直方向にピボットする処理ステージです。

水平ピボットは、入力行内の列セットを複数の出力行の単一列にマップします。

垂直ピボットは、入力データ内の行セットを単一または複数の出力列にマップします。

Promote Subrecords 「サブレコードのプロモート」アイコン 入力サブレコードの列を、最上位レベルの列にプロモートします。
Remove Duplicates 「重複の削除」アイコン ソートされた単一のデータ・セットを入力として取得し、重複するレコードをすべて消去し、その結果を出力データ・セットに書き込みます。
Row Generator 「行ジェネレーター」アイコン 指定されたメタデータに適合する模擬データのセットを作成します。
Sample サンプル・アイコン 入力データ・セットをサンプリングします。
Slowly Changing Dimension (SCD) ソート・アイコン スター・スキーマ・データベースのコンテキスト内で作業して、時間の経過とともに現在のデータと履歴データを保管および管理します。
Sort ソート・アイコン 入力列をソートします。
Split Subrecord 「サブレコードの分割」アイコン 入力サブレコード・フィールドを最上位ベクトル列のセットに分割します。
Split Vector 「ベクトルの分割」アイコン 固定長ベクトルのエレメントを、同じ名前の最上位レベルの列のセットにプロモートします。
Surrogate Key Generator stage サロゲート・キー生成プログラム・アイコン サロゲートキー列を生成し、キー・ソースを保守します。
Switch 「スイッチ」アイコン 1 つのデータ・セットを入力として受け取り、セレクター・フィールドの値に基づいて、各入力レコードを出力データ・セットに割り当てます。
Tail テール・アイコン 入力データ・セットの各パーティションから最後の N レコードを選択し、選択したレコードを出力データ・セットにコピーします。
Transformer Transformer アイコン 抽出されたデータを処理し、必要な変換を実行し、データを別のアクティブなステージまたはターゲット・データベースまたはファイルに書き込むステージに渡します。
Wave Generator Wave Generator アイコン データのストリームをモニターし、必要に応じてウェーブ終了マーカーを挿入します。
Web Service Web サービス・アイコン DataStage フローまたはジョブ内の Web サービス操作にアクセスします。
Write Range Map 「範囲マップの書き込み」アイコン 範囲マップにデータを書き込みます。 このステージには単一の入力リンクを設定できます。

この一連のビデオを視聴して、最も一般的なステージの使用方法を確認してください。