一部のサービス・プランでは、コンピュート使用量およびその他のタイプのリソース使用量に対して課金されます。 IBM Cloud アカウント所有者または管理者は、リソース使用量をモニターして、制限を超えないようにすることができます。
ライト・プランの場合は、プランの上限を超えることはできません。 月ごとに計算されるリソースを使用するには、次の請求月の始まりまで待つ必要があります。 あるいは、 有料プランへアップグレードすることもできます。
ほとんどの有料プランでは、サービスによって提供されるツールとプロセスが毎月消費するリソースに対して支払いを行います。
プランのコストを確認するには、 IBM Cloudにログインし、 IBM Cloud ダッシュボードからサービス・インスタンスを開き、 計画をクリックします。
コンピュート使用量のキャパシティー・ユニット時間 (CUH)
多くのツールは、キャパシティー・ユニット時間 (CUH) で測定されるコンピュート使用量を消費します。 キャパシティー・ユニット時間は、コストが設定されている特定量の計算能力です。
CUH 使用量の測定値は何ですか?
キャパシティ・ユニット・アワー(CUH)またはリソース・ユニット(RU)のどちらで測定されるにせよ、リソースは資産の稼働のために消費されるものであり、ツールでの作業のために消費されるものではない。 つまり、AutoAI,で実験を定義するのに消費料金はかからないが、実験パイプラインを訓練するために実験を実行するのには料金がかかる。 同様に、デプロイメント・スペースの作成またはデプロイメント・ジョブの定義には課金されませんが、デプロイメント・ジョブの実行またはデプロイ済み資産に対する推論には課金されます。 Jupyter ノートブック、RStudio 資産、Bash スクリプトなど、継続的に実行される資産は、アクティブになっている限りリソースを消費します。
コンピュート使用量の計算方法
各種のプロセスおよび各レベルの計算能力が、1 時間当たりのキャパシティー・ユニットに対応するそれぞれの料金で請求されます。 例えば、データのプロファイル作成プロセスの時間単位の料金は 6 キャパシティー・ユニットです。
watsonx.aiStudio の計算使用量は分単位で課金され、最小課金は 10 分0.16時間)です。 watsonx.aiRuntime の計算使用量は分単位で課金され、最小課金時間は 1 分です。
コンピュート使用量の計算では、プロセスごとに請求される最小時間 (最小分数) に、最小分数を超えた分のプロセス実行期間を分単位で加算して、その合計にそのプロセスのキャパシティー・ユニット料金を乗算します。
以下の表は、請求先 CUH の計算方法の例を示しています。
レート | 使用時間 | 計算 | 合計 CUH 請求 |
---|---|---|---|
1 CUH/時 | 1 時間 | 1 時間 * 1 CUH/時 | 1 CUH |
2 CUH/ 時 | 45分 | 0.75 時間 * 2 CUH/ 時 | 1.5 CUH (CUH) |
6 CUH/ 時 | 5 分間 | 0.16 時間 * 6 CUH/ 時 | 0.96 CUH。 watsonx.aiStudio の最低利用料金が適用されます。 |
6 CUH/ 時 | 30 分間 | 0.5 時間 * 6 CUH/ 時 | 3 CUH (CUH) |
6 CUH/ 時 | 1 時間 | 1 時間 * 6 CUH/時 | 6 CUH |
キャパシティー・ユニット時間を消費するプロセス
AutoAI や統合学習など、一部のタイプのプロセスでは、ランタイムの計算速度が 1 つになります。 しかし、多くのツールでは、ランタイムに使用する計算資源を選択することができます。 ノートブック・エディター、 Data Refinery、 SPSS Modeler、およびその他のツールには、環境のメモリーと計算能力を反映するさまざまな速度があります。 より多くのメモリーがあり、計算能力が高い環境は、キャパシティー・ユニット時間の消費料金も高くなります。
この表は、CUH を使用する各プロセス、CUH が実行される場所、どのサービスに対して CUH が請求されるか、および複数の環境から選択できるかどうかを示しています。 各プロセスで使用可能な CUH 率を表示するには、リンクに従ってください。
ツールまたはプロセス | ワークスペース | CUH を提供するサービス | CUH レートが複数ありますか? |
---|---|---|---|
ノートブック・エディター | プロジェクト | watsonx.aiStudio、Analytics Engine(Spark) | 複数のレート |
ノートブックからの機械学習 API の呼び出し | プロジェクト | watsonx.aiランタイム | 複数のレート |
Data Refinery | プロジェクト | watsonx.aiスタジオ | 複数のレート |
SPSS Modeler | プロジェクト | watsonx.aiスタジオ | 複数のレート |
RStudio IDE | プロジェクト | watsonx.aiスタジオ | 複数のレート |
AutoAI エクスペリメント | プロジェクト | watsonx.aiランタイム | 複数のレート |
意思決定最適化のエクスペリメント | スペース | watsonx.aiランタイム | 複数のレート |
デプロイメントの実行 | スペース | watsonx.aiランタイム | 複数のレート |
プロファイル作成 | プロジェクト | watsonx.aiスタジオ | 1 つの速度 |
Synthetic Data Generator | プロジェクト | watsonx.aiスタジオ | 1 つの速度 |
オーケストレーション・パイプライン | プロジェクトおよびスペース | watsonx.aiスタジオ | 複数のレート |
コンピュート使用量のモニター
アカウント・レベルですべてのサービスのコンピュート使用量をモニターできます。 サービスの月次 CUH 使用量を表示するには、 IBM Cloud ダッシュボードからサービス・インスタンスを開き、 「プラン」をクリックします。
「管理」 タブの 「環境」 ページで、プロジェクトのコンピュート使用量をモニターすることもできます。
watsonx.aiStudio とwatsonx.aiRuntime で使用された容量単位時間の合計と、残りの容量単位時間を見るには、Environment Runtimesページをご覧ください。 ナビゲーション・メニューから、 「管理」>「環境ランタイム」を選択します。 「環境ランタイム」 ページには、 環境で使用される CUHの詳細が表示されます。 使用された合計時間数から環境で使用された時間数を減算することで、データ・フローとプロファイル作成に使用する CUH 数を計算できます。
基盤モデルの推論のためのリソース単位
プロンプトに応答して出力を生成するために基盤モデルを呼び出すことは、推論と呼ばれます。 基盤モデルの推論は、リソース単位 (RU) で測定されます。 各 RU は 1,000 トークンに相当します。 トークンは、基盤モデル・プロンプトの入力または出力で使用されるテキストの基本単位 (通常は 4 文字または 0.75 ワード) です。 トークンについて詳しくは、 トークンを参照してください。
リソース単位の請求は、基盤モデル・クラスのレートにトークン数を乗算したものに基づきます。 基盤モデルは 3 つのクラスに分類されます。 リソース単位の計量を参照してください。
基盤モデルの推論のためのトークン使用量のモニター
「管理」 タブの 「環境」 ページで、プロジェクト内の基盤モデル・トークンの使用状況をモニターできます。
月次請求のモニター
リソース使用量情報を確認するには、IBM Cloud アカウント所有者または管理者でなければなりません。
月次請求の要約を表示するには、ナビゲーション・メニューから 「管理」>「アカウントと請求」>「請求および使用量」を選択します。 IBM Cloud 使用状況ダッシュボードが開きます。 各サービスの使用量を表示するには、 「使用量の要約」 セクションで 「使用量の表示」をクリックします。
詳細情報
- プロジェクトでツールを実行するためのコンピュート・リソースの選択
- サービスのアップグレード
- 環境のコンピュート使用量
- watsonx.aiStudioの提供プラン
- watsonx.aiランタイムプランとコンピュート使用量
親トピック: プラットフォームの管理