DataStageのヘッドステージ
Head ステージは、入力データ・セットの各パーティションから最初の N 行を選択し、選択した行を出力データ・セットにコピーします。 このステージを使用してデータをサンプリングできます。
Head ステージは、開発ステージおよびデバッグ・ステージです。 このステージには 1 つの入力リンクおよび 1 つの出力リンクを設定できます。 これは、データのサンプリングを支援するために IBM® DataStage® が提供するいくつかのステージの 1 つです。以下も参照してください。
- テールステージ、DataStageのテールステージ。
- サンプルステージ、DataStage のサンプルステージ。
- 覗き見ステージ、DataStageの覗き見ステージ。
Head ステージは、入力データ・セットの各パーティションから最初の N 行を選択し、選択した行を出力データ・セットにコピーします。 以下を指定できるプロパティーを設定することにより、どの行をコピーするかを決定します
- コピーする行数
- 行のコピー元となるパーティション
- コピーする行の場所
- コピー操作の開始前にスキップする行の数
このステージは、大きなデータ・セットを扱うアプリケーションのテストやデバッグを行う際に役立ちます。 例えば、「パーティション」プロパティーを 使用すると、1 つのパーティション内のデータを確認して、データが意図したとおりにパーティション化 されているかどうかを判断できます。 また、「スキップ」プロパティーを使用すると、データ・セットの特定の部分にアクセスできます。
ステージをダブルクリックすると、「プロパティー」パネルが開きます。 プロパティー・パネルには、次の 3 つのタブがあります。
- ステージ。 常に表示され、ステージの全般的な情報を指定するために使用します。
- 入力。 レコードの選択元となる単一の入力セットの詳細を指定します。
- 出力。 ステージから出力される処理済みデータの詳細を指定します。
「入力」タブ
「列」 セクションは、受信データの列定義を指定します。 「拡張」セクションでは、入力リンクのデフォルトのバッファリング設定を変更することができます。
「出力」タブ
Head ステージに設定できる出力リンクは 1 つだけです。
「列」セクションは、データの列定義を指定します。 「列」セクションで「編集」をクリックすると表示される「列入力列からのマップ」セクションでは、Head ステージに入力される列と出力列の間の関係を指定できます。 「拡張」セクションでは、出力リンクのデフォルトのバッファリング設定を変更することができます。