0 / 0
資料の 英語版 に戻る

DataStageの差分ステージ

最終更新: 2025年3月12日
DataStage の Difference ステージ

Difference ステージは、2 つの入力データ・セットのレコードごとの比較を実行します。これらのデータ・セットは、データ・セットの前と後に指定されたものとは異なるバージョンです。

Difference ステージは処理ステージです。 これは、レコードがそれらの間の相違を表す単一データ・セットを出力します。 入力データ・セットは、あらかじめ Difference ステージの比較用に指定したキー列に基づいてパーティション化され、昇順にソートされている必要があります。 この処理は Sort ステージを使用するか、Difference ステージに組み込まれたソートとパーティションの機能を使用して実行できます。

比較は一連の差分キー列に基づいて行われます。 2 つのレコードがすべての差分キーについて同じ値を持つ場合、レコードは互いにコピーであると見なせます。 オプションで、 変更値を指定することもできます。 2 つのレコードのキー列が一致した場合は、値列を比較して、一方がもう一方を編集したコピーであるかどうかを確認できます。

Differenceステージは、DataStageのキャプチャ・ステージを変更するで説明したChange Captureステージと似ていますが、同一ではありません。 Change Capture ステージは、Change Apply ステージと一緒に使用することを目的としています。このステージは、変更データ・セットを生成します。このデータ・セットを データ・セットにするために データ・セットに適用する必要がある変更が含まれています。 Difference ステージは、出力データ・セットへの行の前と後、および相違点があるかどうかを示すコードを出力します。 前と後のデータの列名が同じ場合は、1 つのデータ・セットが他のデータ・セットを効率的に上書きするので、出力には 1 セットの列しか表示されません。 どのデータ・セットが出力されるかは、「ステージ」タブの「リンク順序」セクションの設定によって制御されます。 のデータ・セットの列名が異なる場合は、「出力」 タブで列を編集するときに、両方のデータ・セットからの列が、マッピング・オプションで設定されたセットとして出力されることがあります。 入力データ・セット内のキー列または値列として指定されている列は、いずれも同じ名前である必要があります。

Difference ステージをダブルクリックすると、プロパティー・パネルが開きます。 プロパティー・パネルには、次の 3 つのタブがあります。

  • ステージ。 常に表示され、ステージの全般的な情報を指定するために使用します。
  • 入力. グループ化またはアグリゲートするデータの 詳細を指定します。
  • 出力. ステージから出力される グループの詳細を指定します。

「入力」タブ

「列」タブは、受信データの列定義を指定します。 「拡張」タブでは、入力リンクのデフォルトのバッファリング設定を変更することができます。

「出力」タブ

Difference ステージに設定できる出力リンクは 1 つだけです。

「列」 タブでは、データの列定義を指定します。 「列」セクションの下部にある「編集」をクリックして、差分ステージに入力する列と「出力」列の間の列の関係を指定します。 「拡張」セクションでは、出力リンクのデフォルトのバッファリング設定を変更することができます。