DataStageに設定されたルックアップ・ファイル
ルックアップ・ファイル・セットを使用して、ルックアップ用のファイル・セットまたは参照を作成します。
ルックアップ・ファイル・セットを使用して、新規ファイル・セットを作成するか、ルックアップ用に 1 つ参照します。 ルックアップ・ファイル・セットには、単一の入力リンクまたは 1 つの出力リンクを設定できます。 出力リンクは参照リンクでなければなりません。 ルックアップ・ファイル・セットは、入力リンクとともに使用すると、パラレル・モードまたは逐次モードで実行するように構成できます。
ルックアップ・ファイル・セットの作成時、パーティションごとに 1 つのファイルが作成されます。 個々のファイルは通常、単一のディスクリプター・ファイルによって参照されます。これには慣例により、サフィックス .fs が付いています。
ルックアップ・データのソースとしてルックアップ・ファイル・セットを使用する場合、列の命名には特別に考慮すべき事項があります。 ソース・データ・セットとルックアップ・データ・セットの両方に同じ名前列がある場合は、ソース・データ・セットの列が出力データに移動します。 この列をルックアップ・データ・ソースからの列で置換する場合は、ルックアップを実行する前にソース・データ列をドロップする必要があります (例えば、Modify ステージを使用して実施できます)。
ステージ・タブ
- 実行モード。 コネクターは、パラレル・モードまたは順次モードで実行できます。 パラレル・モードでは、データ・セットの内容は、構成ファイルで指定された使用可能なノード、および「拡張」 タブで指定されたノードの制約によって処理されます。 順次モードでは、データ・セットの内容全体がコンダクター・ノードによって処理されます。
- 組み合わせ可能モード。 これはデフォルトで「自動」になっています。これにより、 IBM® DataStage® は、パラレル・ステージの基礎となるオペレーターを結合して、このタイプのステージで適切な場合に同じプロセスで実行することができます。
- パーティションの保持。 プロパゲート、セット、またはクリアを選択できます。 「セット」 を選択すると、ファイル読み取り操作は、次のステージがパーティションを保持するように要求します。 プロパゲーションにより、前のステージからのフラグの設定が行われます。
入力
「入力」タブでは、ルックアップ・ファイル・セットがデータをファイル・セットに書き込む方法についての詳細を指定できます。 ルックアップ・ファイル・セットに設定できる入力リンクは 1 つだけです。
- ルックアップ・キー
ルックアップ・キー列の名前を指定します。 複数のキー列がある場合は、キープロパティーを繰り返すことができます。 このプロパティーには、2 つの従属プロパティーがあります。
- 大 / 小文字の区別
これはキーの従属プロパティーで、親キーが大/小文字を区別するかどうかを指定します。 デフォルトで True に設定されます。
- 保持
これは、キー列をルックアップの後に出力ストリームにプロパゲーションする必要があるか、または後続の条件式で使用する必要があるかを指定します。 デフォルトでは False に設定されます。
- 大 / 小文字の区別
- ルックアップ・ファイル・セット
- ファイルセットを定義します。 ファイル・セットのディスクリプター・ファイルのパス名を入力することができます (拡張子は .fs で終了します)。
ルックアップ範囲:
ルックアップの範囲が必要かどうかを指定します。 ルックアップの範囲は、ソース列の値を 2 つのルックアップ列間の値の範囲と比較します。 代わりに、ルックアップ列の値を 2 つのソース列の間の値の範囲と比較することもできます。
ルックアップの範囲を指定する場合は、通常、「オプション」カテゴリーの「重複を許可」プロパティーを「True」に設定する必要があります。 主キーが複数行を返すことができるように、重複を許可します。
このルックアップ範囲のプロパティーには、以下の従属プロパティーがあります。
- 有界列
ルックアップ・ファイル・セットに使用する入力列を指定します。 ルックアップ・テーブルは、有界列を使用して作成されます。この列は、ソース・データ・セットの列の範囲と比較されます。 このプロパティーは、「下限」および「上限」と同時には使用できません。 次の 2 つの従属プロパティーがあります。
- 大 / 小文字の区別
これはオプションのプロパティーです。 列が大/小文字の区別をするかどうかを指定します。 デフォルトで True に設定されます。
- 保持
列をルックアップの後に出力ストリームにプロパゲーションする必要があるか、後続の条件式で使用する必要があるかを指定します。 デフォルトでは False に設定されます。
- 大 / 小文字の区別
- 下限
ルックアップ・テーブル内の範囲の下限に使用する入力列を指定します。 これには、上限列と同じ値は使用できません。また、「有界列」と同時には使用できません。 次の 2 つの従属プロパティーがあります。
- 大 / 小文字の区別
これはオプションのプロパティーです。 列が大/小文字の区別をするかどうかを指定します。 デフォルトで True に設定されます。
- 保持
列をルックアップの後に出力ストリームにプロパゲーションする必要があるか、後続の条件式で使用する必要があるかを指定します。 デフォルトでは False に設定されます。
- 大 / 小文字の区別
- 上限
ルックアップ・テーブル内の範囲の上限に使用する入力列を指定します。 これには、下限列と同じ値は使用できません。また、「有界列」と同時には使用できません。 次の 2 つの従属プロパティーがあります。
- 大 / 小文字の区別
これはオプションのプロパティーです。 列の値が大/小文字を区別するかどうか指定します。 デフォルトで True に設定されます。
- 保持
列をルックアップの後に出力ストリームにプロパゲーションする必要があるか、後続の条件式で使用する必要があるかを指定します。 デフォルトでは False に設定されます。
- 大 / 小文字の区別
- 重複を許可する
- これを設定すると、重複レコードの複数のコピーが、警告が出ることなくルックアップ・テーブルに保存されます。 2 つのルックアップ・レコードが重複しているのは、すべてのルックアップ・キー列が 2 つのレコード内で同じ値を持つ場合です。 このオプションを指定しないと、システムは重複レコードを検出し、一致するレコードの 1 つ目のレコードをすべて破棄して、警告メッセージを発行します。
- ディスク・プール
- これはオプションのプロパティーです。 ファイル・セットの書き込み先となるディスク・プールの名前を指定します。 ジョブ・パラメーターを指定することもできます。
出力
「出力」タブでは、ルックアップ・ファイル・セットのコネクターがファイル・セットを参照する方法の詳細を指定できます。
- ルックアップ・ファイル・セット
- このプロパティーは、データが参照されるファイル・セットを定義します。 ファイル・セットのディスクリプター・ファイルのパス名を入力することができます (拡張子は .fs で終了します)。