プロジェクトで Data Refinery フローを作成または編集する場合は、 Default Data Refinery XS
ランタイム環境を使用します。 ただし、ジョブで Data Refinery フローを実行する場合は、ランタイム環境の環境テンプレートを選択します。 環境テンプレートは、ハードウェア構成のタイプ、サイズ、および能力に加えて、ソフトウェア・テンプレートも指定します。
環境のタイプ
Data Refinery では以下のタイプの環境を使用できます。
- 小規模なデータ・セットでジョブを実行するための
Default Data Refinery XS
ランタイム環境です。 - 大規模なデータ・セットでジョブを実行するための Spark 環境です。 Spark 環境には デフォルト環境テンプレート があるため、すぐに開始できます。 そうでない場合は、Spark 環境のために カスタム環境テンプレートを作成 できます。 Spark & R 環境は、大規模なデータ・セットを処理する場合にのみ使用してください。 データ・セットが小さい場合は、
Default Data Refinery XS
ランタイムを選択する必要があります。 その理由は、Spark & R 環境の SparkR クラスターは高速かつ強力ですが、小さなデータ・セットで Data Refinery ジョブを実行する場合に顕著な作成時間が必要になるためです。
デフォルトの環境テンプレート
Data Refineryで作業する場合は、以下のようになります。 Default Data Refinery XS
環境ランタイムが開始され、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブなランタイムとして表示されます。 このランタイムは、Data Refinery インターフェースで非アクティブ状態が 1 時間続くと停止します。 ただし、 「環境」 ページの 「ツール・ランタイム」 で手動で停止することができます。
プロジェクトで Data Refinery フローを実行するジョブを作成するときに、環境テンプレートを選択します。 ジョブのランタイムが開始されると、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブ・ランタイムとしてリストされます。 Data Refinery ジョブの実行が停止すると、ジョブのランタイムが停止します。
コンピュート使用量は、キャパシティー・ユニット時間 (CUH) によって追跡されます。
名前 | ハードウェア構成 | キャパシティー・ユニット / 時 (CUH) |
---|---|---|
デフォルト Data Refinery XS | 3 個の vCPU および 12 GB の RAM | 1.5 |
デフォルト Spark 3.4 & R 4.2 | それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM; Driver: 1 vCPU and 4 GB RAM |
1.5 |
デフォルト Spark 3.3 & R 4.2 非推奨 |
それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM; Driver: 1 vCPU and 4 GB RAM |
1.5 |
Data Refinery のすべてのデフォルト環境テンプレートは HIPAA に対応しています。
Spark のデフォルト環境テンプレートは、プロジェクトの 「管理」 タブの 「環境」 ページの 「テンプレート」 の下にリストされます。
プロジェクトのコンピュート使用量
プロジェクトのManageタブにあるResource usageページで、watsonx.aiStudio の CUH 消費量をモニターできます。
ランタイムの変更
Data Refineryで作業するためにランタイムを変更することはできません。
ジョブ・テンプレートを編集することで、Data Refinery フロー・ジョブのランタイムを変更できます。 Data Refinery でのジョブの作成を参照してください。
ジョブのランタイム・ログ
Data Refinery ジョブの累積ログを表示するには、以下のようにします。
- プロジェクトの ジョブ ページで、ログを表示する対象の Data Refinery フローを実行したジョブをクリックします。
- ジョブ実行をクリックします。 ログの末尾を表示するか、完全なログ・ファイルをダウンロードすることができます。
今後のステップ
詳細情報
親トピック: ツールのコンピュート・リソースの選択