重複ステージの削除ステージタブ (DataStage)
最終更新: 2025年3月12日
「ステージ」タブでステージをダブルクリックし、設定を更新すると、「変更」ステージの各側面を指定できます。
Remove Duplicates ステージをダブルクリックしてステージ・エディターを開きます。 「ステージ」タブで、「プロパティー」セクションを使用して、ステージが何を行うかを指定できます。 「拡張」セクションでは、ステージの実行方法を指定できます。
プロパティ-
以下のプロパティーを指定できます。
カテゴリー/プロパティー | 値 | デフォルト | 必須? | 繰り返しますか? | 従属先: |
---|---|---|---|---|---|
重複/キーを定義するキー | 入力列 | N/A | Y | Y | N/A |
重複/大小文字を区別するキー | True/False | はい | N | N | キー |
重複を定義するキー/EBCDIC としてソートするキー | True/False | いいえ | N | N | キー |
オプション/保存する重複 | 最初/最後 | 初めの n 件 | Y | N | N/A |
キー
操作のキー列を指定します。 このプロパティーを繰り返して、複数のキー列を指定できます。 「列の選択」 ダイアログ・ボックスを使用して、必要に応じて複数のキーを一度に選択できます。 キーには、以下のように従属プロパティーがあります。
- 大 / 小文字の区別
これを使用して、各キーが大/小文字を区別するかどうかを指定します。これは、デフォルトでは「True」に設定されています。つまり、値「CASE」と「case」は同等と判断されません。
- EBCDIC としてソート
EBCDIC 文字セットのようにソートするには、「True」を選択します。
複製して保持
保持する重複列のうちどれを保持するかを指定します。 ファーストとラストの間を選択します。 これはデフォルトでファーストに設定されています。
拡張
このセクションでは、以下を指定できます。
- 実行モード。 このステージは、パラレル・モードまたは順次モードで実行できます。 パラレル・モードでは、入力データは、構成ファイルで指定されている使用可能なノード、および「拡張」 セクションに指定されたノード制約によって処理されます。 順次モードでは、データ・セット全体がコンダクター・ノードで処理されます。
- 組み合わせ可能モード。 これはデフォルトでは「自動」です。これにより、 IBM® DataStage® は、並列ステージの基礎となるオペレーターを結合して、このタイプのステージに適している場合に同じプロセスで実行できるようにします。
- パーティションの保持。 このデフォルトは「セット」です。 「セット」または「クリア」を明示的に選択できます。 「セット」を選択して、次のステージがパーティションの維持を試みるように要求します。
トピックは役に立ちましたか?
0/1000