0 / 0
資料の 英語版 に戻る

DataStageに設定されたファイル

最終更新: 2025年3月12日
DataStageに設定されたファイル

ファイル・セットをソースまたはターゲットとして使用します。 データの読み取りまたはファイル・セットへのデータの書き込みを行うことができます。

このファイル・セットには、単一の入力リンク、単一の出力リンク、および単一のリジェクト・リンクを設定できます。 パラレル・モードでのみ実行されます。

IBM® DataStage® は、エクスポートされたファイルを生成して名前を付け、その宛先に書き込み、拡張子が .fs であるファイルに生成したファイルをリストすることができます。 これらのデータ・ファイルおよびそれらをリストするファイルは、ファイル・セットと呼ばれます。 いくつかのオペレーティング・システムではファイルのサイズに 2 GB の制限があり、オーバーランを防ぐためにノード間でファイルを分散する必要があるため、この機能は役立ちます。

各宛先データ・ファイルに保管できるデータの量は、ファイル・システムの特性と使用可能な空きディスク・スペースの量によって制限されます。 ファイル・セットによって作成されるファイルの数は、以下によって異なります。

  • デフォルト・ノード・プール内の処理ノードの数
  • デフォルト・ノード・プール内の各処理ノードに接続された、エクスポートまたはデフォルトのディスク・プール内のディスクの数
  • データ・セットのパーティションのサイズ

データ・セットとは異なり、ファイル・セットは、読み取りまたは書き込みが行われるファイルのフォーマットを記述するフォーマット情報を伝送します。

ファイル・セットをダブルクリックして、プロパティー・パネルを開きます。 このパネルには、データ・セットを読み書きするかどうかに応じて、最大 3 つのタブがあります。

ステージ・タブ

以下の拡張プロパティーを指定できます。
  • 実行モード。 このステージは、パラレル・モードまたは順次モードで実行できます。 パラレル・モードでは、データ・セットの内容は、構成ファイルで指定された使用可能なノード、および「拡張」 タブで指定されたノードの制約によって処理されます。 順次モードでは、データ・セットの内容全体がコンダクター・ノードによって処理されます。
  • 組み合わせ可能モード。 これはデフォルトで「自動」になっています。これにより、 IBM DataStage は、並列ステージの基礎となるオペレーターを結合して、このタイプのステージで適切な場合に同じプロセスで実行できるようにします。
  • パーティションの保持プロパゲートセット、またはクリアを選択できます。 「セット」 を選択すると、ファイル読み取り操作は、次のステージがパーティションを保持するように要求します。 プロパゲーションにより、前のステージからのフラグの設定が行われます。

「入力」タブ

「入力」タブでは、ファイル・セットがデータを書き込む方法についての詳細を指定できます。 このファイル・セットに設定できる入力リンクは 1 つだけです。 詳細は入力タブ (DataStage)を参照してください。

「出力」タブ

「出力」タブでは、ファイル・セットからのデータの読み取り方法の詳細を指定することができます。 詳細は出力タブ (DataStage)を参照。