当サイトのクッキーについて IBM のWeb サイトは正常に機能するためにいくつかの Cookie を必要とします(必須)。 このほか、サイト使用状況の分析、ユーザー・エクスペリエンスの向上、広告宣伝のために、お客様の同意を得て、その他の Cookie を使用することがあります。 詳細については、オプションをご確認ください。 IBMのWebサイトにアクセスすることにより、IBMのプライバシー・ステートメントに記載されているように情報を処理することに同意するものとします。 円滑なナビゲーションのため、お客様の Cookie 設定は、 ここに記載されている IBM Web ドメイン間で共有されます。
プロジェクトでの Data Refinery の計算リソース・オプション
最終更新: 2025年2月28日
プロジェクトで Data Refinery フローを作成または編集する場合は、
ランタイム環境を使用します。 ただし、ジョブで Data Refinery フローを実行する場合は、ランタイム環境の環境テンプレートを選択します。 環境テンプレートは、ハードウェア構成のタイプ、サイズ、および能力に加えて、ソフトウェア・テンプレートも指定します。Default Data Refinery XS
環境のタイプ
Data Refinery では以下のタイプの環境を使用できます。
- 小規模なデータ・セットでジョブを実行するための
ランタイム環境です。Default Data Refinery XS
- 大規模なデータ・セットでジョブを実行するための Spark 環境です。 Spark 環境には デフォルト環境テンプレート があるため、すぐに開始できます。 そうでない場合は、Spark 環境のために カスタム環境テンプレートを作成 できます。 Spark & R 環境は、大規模なデータ・セットを処理する場合にのみ使用してください。 データ・セットが小さい場合は、
ランタイムを選択する必要があります。 その理由は、Spark & R 環境の SparkR クラスターは高速かつ強力ですが、小さなデータ・セットで Data Refinery ジョブを実行する場合に顕著な作成時間が必要になるためです。Default Data Refinery XS
デフォルトの環境テンプレート
Data Refineryで作業する場合は、以下のようになります。
環境ランタイムが開始され、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブなランタイムとして表示されます。 このランタイムは、Data Refinery インターフェースで非アクティブ状態が 1 時間続くと停止します。 ただし、 「環境」 ページの 「ツール・ランタイム」 で手動で停止することができます。Default Data Refinery XS
プロジェクトで Data Refinery フローを実行するジョブを作成するときに、環境テンプレートを選択します。 ジョブのランタイムが開始されると、プロジェクトの 「管理」 タブの 「環境」 ページの 「ツール・ランタイム」 の下にアクティブ・ランタイムとしてリストされます。 Data Refinery ジョブの実行が停止すると、ジョブのランタイムが停止します。
コンピュート使用量は、キャパシティー・ユニット時間 (CUH) によって追跡されます。
名前 | ハードウェア構成 | キャパシティー・ユニット / 時 (CUH) |
---|---|---|
デフォルト Data Refinery XS | 3 個の vCPU および 12 GB の RAM | 1.5 |
デフォルト Spark 3.4 & R 4.2 | 2 Executors each: 1 vCPU and 4 GB RAM; Driver: 1 vCPU and 4 GB RAM |
1.5 |
デフォルト Spark 3.3 & R 4.2 非推奨 |
2 Executors each: 1 vCPU and 4 GB RAM; Driver: 1 vCPU and 4 GB RAM |
1.5 |
注意: NotebooksとJupyterLabのSpark 3.3は非推奨です。 Spark 3.3 を使用してノートブックやスクリプトを実行することはできますが、Spark 3.4 への移行を検討してください。
Data Refinery のすべてのデフォルト環境テンプレートは HIPAA に対応しています。
Spark のデフォルト環境テンプレートは、プロジェクトの 「管理」 タブの 「環境」 ページの 「テンプレート」 の下にリストされます。
プロジェクトのコンピュート使用量
Data Refineryは、watsonx.aiStudioとIBM Knowledge Catalogの両方で提供される。 ただし、両方のサービスがある場合、Data Refinery での作業に使用するコンピュート・リソース、およびプロジェクトで Data Refinery フローのジョブを実行するために使用するコンピュート・リソースは累積されません。 プランの CUH は、次の優先順位のうち、最も高いもので使用します。
- エンタープライズまたはプロフェッショナル
- Standard
- ライト
例えば、watsonx.aiStudio Lite プランとIBM Knowledge CatalogProfessional プランをお持ちの場合、IBM Knowledge CatalogCUH を使用します。
両方のサービスのプランレベルが同じであれば、watsonx.aiStudio の CUH を使用します。 例えば、watsonx.aiStudio Lite プランとIBM Knowledge CatalogLite プランをお持ちの場合、watsonx.aiStudio CUH の上限までしか使用できません。 IBM Knowledge Catalog CUHの使用に切り替えることはできません。
プロジェクトのManageタブにあるResource usageページで、watsonx.aiStudio の CUH 消費量をモニターできます。
IBM Knowledge Catalog CUH の消費を監視することはできません。
ランタイムの変更
Data Refineryで作業するためにランタイムを変更することはできません。
ジョブ・テンプレートを編集することで、Data Refinery フロー・ジョブのランタイムを変更できます。 Data Refinery でのジョブの作成を参照してください。
ジョブのランタイム・ログ
Data Refinery ジョブの累積ログを表示するには、以下のようにします。
- プロジェクトの ジョブ ページで、ログを表示する対象の Data Refinery フローを実行したジョブをクリックします。
- ジョブ実行をクリックします。 ログの末尾を表示するか、完全なログ・ファイルをダウンロードすることができます。
次のステップ
もっと見る
親トピック: ツールのコンピュート・リソースの選択
トピックは役に立ちましたか?
0/1000