0 / 0
資料の 英語版 に戻る
プロジェクトでの Data Refinery の計算リソース・オプション
最終更新: 2024年11月21日
プロジェクトでの Data Refinery の計算リソース・オプション

プロジェクトで Data Refinery フローを作成または編集する場合は、 Default Data Refinery XS ランタイム環境を使用します。 ただし、ジョブで Data Refinery フローを実行する場合は、ランタイム環境の環境テンプレートを選択します。 環境テンプレートは、ハードウェア構成のタイプ、サイズ、および能力に加えて、ソフトウェア・テンプレートも指定します。

環境のタイプ

Data Refinery では以下のタイプの環境を使用できます。

  • 小規模なデータ・セットでジョブを実行するための Default Data Refinery XS ランタイム環境です。
  • 大規模なデータ・セットでジョブを実行するための Spark 環境です。 Spark 環境には デフォルト環境テンプレート があるため、すぐに開始できます。 そうでない場合は、Spark 環境のために カスタム環境テンプレートを作成 できます。 Spark & R 環境は、大規模なデータ・セットを処理する場合にのみ使用してください。 データ・セットが小さい場合は、 Default Data Refinery XS ランタイムを選択する必要があります。 その理由は、Spark & R 環境の SparkR クラスターは高速かつ強力ですが、小さなデータ・セットで Data Refinery ジョブを実行する場合に顕著な作成時間が必要になるためです。

デフォルトの環境テンプレート

Data Refineryで作業する場合は、以下のようになります。 Default Data Refinery XS 環境ランタイムが開始され、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブなランタイムとして表示されます。 このランタイムは、Data Refinery インターフェースで非アクティブ状態が 1 時間続くと停止します。 ただし、 「環境」 ページの 「ツール・ランタイム」 で手動で停止することができます。

プロジェクトで Data Refinery フローを実行するジョブを作成するときに、環境テンプレートを選択します。 ジョブのランタイムが開始されると、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブ・ランタイムとしてリストされます。 Data Refinery ジョブの実行が停止すると、ジョブのランタイムが停止します。

コンピュート使用量は、キャパシティー・ユニット時間 (CUH) によって追跡されます。

Data Refinery のプロジェクトで使用可能な事前設定環境テンプレート
名前 ハードウェア構成 キャパシティー・ユニット / 時 (CUH)
デフォルト Data Refinery XS 3 個の vCPU および 12 GB の RAM 1.5
デフォルト Spark 3.4 & R 4.2 それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM;
Driver: 1 vCPU and 4 GB RAM
1.5
デフォルト Spark 3.3 & R 4.2
非推奨
それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM;
Driver: 1 vCPU and 4 GB RAM
1.5
注意: NotebooksのSpark 3.3とJupyterLabは非推奨です。 Spark 3.3 を使用してノートブックやスクリプトを実行することはできますが、Spark 3.4 への移行を検討してください。

Data Refinery のすべてのデフォルト環境テンプレートは HIPAA に対応しています。

Spark のデフォルト環境テンプレートは、プロジェクトの 「管理」 タブの 「環境」 ページの 「テンプレート」 の下にリストされます。

プロジェクトのコンピュート使用量

プロジェクトのManageタブにあるResource usageページで、watsonx.aiStudio の CUH 消費量をモニターできます。

ランタイムの変更

Data Refineryで作業するためにランタイムを変更することはできません。

ジョブ・テンプレートを編集することで、Data Refinery フロー・ジョブのランタイムを変更できます。 Data Refinery でのジョブの作成を参照してください。

ジョブのランタイム・ログ

Data Refinery ジョブの累積ログを表示するには、以下のようにします。

  1. プロジェクトの ジョブ ページで、ログを表示する対象の Data Refinery フローを実行したジョブをクリックします。
  2. ジョブ実行をクリックします。 ログの末尾を表示するか、完全なログ・ファイルをダウンロードすることができます。

今後のステップ

詳細情報

親トピック: ツールのコンピュート・リソースの選択

生成 AI の検索と回答
これらの回答は、製品資料の内容に基づいて、 watsonx.ai のラージ言語モデルによって生成されます。 詳細