0 / 0

重複ステージの削除ステージタブ (DataStage)

最終更新: 2025年3月12日
Remove Duplicates ステージ:「ステージ」タブ (DataStage)

「ステージ」タブでステージをダブルクリックし、設定を更新すると、「変更」ステージの各側面を指定できます。

Remove Duplicates ステージをダブルクリックしてステージ・エディターを開きます。 「ステージ」タブで、「プロパティー」セクションを使用して、ステージが何を行うかを指定できます。 「拡張」セクションでは、ステージの実行方法を指定できます。

プロパティ-

以下のプロパティーを指定できます。
表 1. プロパティ-
カテゴリー/プロパティー デフォルト 必須? 繰り返しますか? 従属先:
重複/キーを定義するキー 入力列 N/A Y Y N/A
重複/大小文字を区別するキー True/False はい N N キー
重複を定義するキー/EBCDIC としてソートするキー True/False いいえ N N キー
オプション/保存する重複 最初/最後 初めの n 件 Y N N/A

キー

操作のキー列を指定します。 このプロパティーを繰り返して、複数のキー列を指定できます。 「列の選択」 ダイアログ・ボックスを使用して、必要に応じて複数のキーを一度に選択できます。 キーには、以下のように従属プロパティーがあります。

  • 大 / 小文字の区別

    これを使用して、各キーが大/小文字を区別するかどうかを指定します。これは、デフォルトでは「True」に設定されています。つまり、値「CASE」と「case」は同等と判断されません。

  • EBCDIC としてソート

    EBCDIC 文字セットのようにソートするには、「True」を選択します。

複製して保持

保持する重複列のうちどれを保持するかを指定します。 ファーストラストの間を選択します。 これはデフォルトでファーストに設定されています。

拡張

このセクションでは、以下を指定できます。

  • 実行モード。 このステージは、パラレル・モードまたは順次モードで実行できます。 パラレル・モードでは、入力データは、構成ファイルで指定されている使用可能なノード、および「拡張」 セクションに指定されたノード制約によって処理されます。 順次モードでは、データ・セット全体がコンダクター・ノードで処理されます。
  • 組み合わせ可能モード。 これはデフォルトでは「自動」です。これにより、 IBM® DataStage® は、並列ステージの基礎となるオペレーターを結合して、このタイプのステージに適している場合に同じプロセスで実行できるようにします。
  • パーティションの保持。 このデフォルトは「セット」です。 「セット」または「クリア」を明示的に選択できます。 「セット」を選択して、次のステージがパーティションの維持を試みるように要求します。