0 / 0
資料の 英語版 に戻る
プロジェクトでの Data Refinery の計算リソース・オプション
プロジェクトでの Data Refinery の計算リソース・オプション

プロジェクトでの Data Refinery の計算リソース・オプション

プロジェクトで Data Refinery フローを作成または編集する場合は、 Default Data Refinery XS ランタイム環境を使用します。 ただし、ジョブで Data Refinery フローを実行する場合は、ランタイム環境の環境テンプレートを選択します。 環境テンプレートは、ハードウェア構成のタイプ、サイズ、および能力に加えて、ソフトウェア・テンプレートも指定します。

環境のタイプ

Data Refinery では以下のタイプの環境を使用できます。

  • 小規模なデータ・セットでジョブを実行するための Default Data Refinery XS ランタイム環境です。
  • 大規模なデータ・セットでジョブを実行するための Spark 環境です。 Spark 環境には デフォルト環境テンプレート があるため、すぐに開始できます。 そうでない場合は、Spark 環境のために カスタム環境テンプレートを作成 できます。 Spark & R 3.6 環境は、大規模なデータ・セットを処理する場合にのみ使用してください。 データ・セットが小さい場合は、 Default Data Refinery XS ランタイムを選択する必要があります。 これは、Spark & R 3.6 環境の SparkR クラスターは高速かつ強力ですが、作成に時間がかかるためです。これは、小規模なデータ・セットで Data Refinery ジョブを実行する場合に顕著です。

デフォルトの環境テンプレート

Data Refineryで作業する場合は、以下のようになります。 Default Data Refinery XS 環境ランタイムが開始され、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブなランタイムとして表示されます。 このランタイムは、Data Refinery インターフェースで非アクティブ状態が 1 時間続くと停止します。 ただし、 「環境」 ページの 「ツール・ランタイム」 で手動で停止することができます。

プロジェクトで Data Refinery フローを実行するジョブを作成するときに、環境テンプレートを選択します。 ジョブのランタイムが開始されると、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブ・ランタイムとしてリストされます。 Data Refinery ジョブの実行が停止すると、ジョブのランタイムが停止します。

コンピュート使用量は、キャパシティー・ユニット時間 (CUH) によって追跡されます。

Data Refinery のプロジェクトで使用可能な事前設定環境テンプレート
名前 ハードウェア構成 キャパシティー・ユニット / 時 (CUH)
デフォルト Spark 3.3 & R 3.6 それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM;
Driver: 1 vCPU and 4 GB RAM
1.5
デフォルト Spark 3.2 & R 3.6
(非推奨)
それぞれ 2 つの実行プログラム: 1 vCPU and 4 GB RAM;
Driver: 1 vCPU and 4 GB RAM
1.5
デフォルト Data Refinery XS 3 個の vCPU および 12 GB の RAM 1.5

Data Refinery のすべてのデフォルト環境テンプレートは HIPAA に対応しています。

Spark のデフォルト環境テンプレートは、プロジェクトの 「管理」 タブの 「環境」 ページの 「テンプレート」 の下にリストされます。

プロジェクトのコンピュート使用量

Data Refinery は、Watson Studio と Watson Knowledge Catalog の両方で提供されています。 ただし、両方のサービスがある場合、Data Refinery での作業に使用するコンピュート・リソース、およびプロジェクトで Data Refinery フローのジョブを実行するために使用するコンピュート・リソースは累積されません。 プランの CUH は、次の優先順位のうち、最も高いもので使用します。

  1. エンタープライズまたはプロフェッショナル
  2. Standard
  3. ライト

例えば、Watson Studio ライト・プランと Watson Knowledge Catalog プロフェッショナル・プランがある場合は、Watson Knowledge Catalog の CUH を使用します。

両方のサービスのプラン・レベルが同じ場合は、 Watson Studioから CUH を使用します。 例えば、 Watson Studio ライト・プランと Watson Knowledge Catalogライト・プランを持つ場合は、 Watson Studio CUH の制限までしか使用できません。 Watson Knowledge Catalog CUH の使用に切り替えることはできません。

Watson Studio CUH 使用量は、プロジェクトの 「管理」 タブの 「リソース使用量」 ページでモニターできます。

Watson Knowledge Catalog CUH 使用量をモニターすることはできません。

ランタイムの変更

Data Refineryで作業するためにランタイムを変更することはできません。

ジョブ・テンプレートを編集することで、Data Refinery フロー・ジョブのランタイムを変更できます。 Data Refinery でのジョブの作成を参照してください。

ジョブのランタイム・ログ

Data Refinery ジョブの累積ログを表示するには、以下のようにします。

  1. プロジェクトの ジョブ ページで、ログを表示する対象の Data Refinery フローを実行したジョブをクリックします。
  2. ジョブ実行をクリックします。 ログの末尾を表示するか、完全なログ・ファイルをダウンロードすることができます。

次のステップ

もっと見る

親トピック: ツールのコンピュート・リソースの選択