機械学習資産の使用量が、キャパシティ・ユニット・アワー(CUH)を使用してどのように測定されるかについて学ぶ。
watsonx.aiランタイム・コンピュート使用量と価格設定
watsonx.aiのランタイム・コンピュート使用量は、アクティブな機械学習インスタンスによって消費されるキャパシティ・ユニット・アワー(CUH)の数によって計算されます。 使用された時間当たりのキャパシティー・ユニットのレートは、Machine Learning 資産およびモデルのコンピューティング要件によって決まります。 例えば、複雑な大規模データ・セットを使用するモデルでは、シンプルな小規模データ・セットを使用するモデルよりも多くのトレーニング・リソースを使用します。 より多くの同時ユーザーおよび要求をサポートするようにデプロイメントをスケーリングすると、CUH 使用量も増加することに注意してください。
全プラン対象:
- トレーニングに消費されるCUH(Capacity-Unit-Hour)レートは、トレーニングツール、ハードウェアの仕様、および実行環境に基づく。
- 配備のための容量単位時間(CUH)率消費は、配備タイプ、ハードウェア仕様、およびソフトウェア仕様に基づいている。
- watsonx.aiRuntime は、1 つの配置スペースごとに保持する配置ジョブの数に制限を設けます。 制限を超えると、既存のジョブを削除するかプランをアップグレードするまで、 新しい配置ジョブを作成できなくなります。 デフォルトでは、ジョブ・メタデータは 30 日後に自動削除されます。 この値は、ジョブの作成時にオーバーライドできます。 管理職を見る
- アイドリングまでの時間とは、スコアリング要求の間に配備をアクティブとみなす時間のことである。 デプロイメントが特定の期間に対するスコアリング要求を受信しない場合、そのデプロイメントは非アクティブまたはアイドルとして扱われ、SPSS 以外のすべてのフレームワークで請求処理が停止します。
- プランでは、少なくとも記載された料率の上限が認められており、実際の料率の上限は記載された上限よりも高くなる可能性がある。 例えば、Liteプランはエラーを出さずに1秒あたり2リクエスト以上を処理するかもしれない。 有料プランをご利用で、誤って料金の上限に達していると思われる場合は、IBMサポートにお問い合わせください。
- コンピュート時間は、ミリ秒単位まで計算されます。 ただし、それぞれの固有の操作に対して最小でも 1 分が課せられます。 つまり、12 秒かかったトレーニング実行は、キャパシティー・ユニット時間の割り当てに対して 1 分として課金されます。一方、83.555 秒かかったトレーニング実行は、その計算された数値のままで課金されます。
- オンライン・デプロイメントが容量単位を消費する方法は、フレームワークに基づいています。 一部のフレームワークの場合は、デプロイメント・スペースでデプロイメント資産がアクティブになっている時間数に対して CUH が課金されます。 例えば、1 日 24 時間、週 7 日間稼働するオンライン・デプロイメント・モードの SPSS モデルは、CUH を消費し、その期間に対して課金されます。 アクティブなオンライン・デプロイメントのアイドル時間はありません。 その他のフレームワークの場合、CUH はスコアリング時間に従って課金されます。 CUH の計算方法について詳しくは、CUH 使用量の表を参照してください。
資産タイプ別CUH消費率
資産タイプ | キャパシティー・タイプ | 1 時間当たりのキャパシティー・ユニット |
---|---|---|
AutoAI エクスペリメント | 8 vCPU および 32 GB RAM | 20 |
Decision Optimizationトレーニング | 2vCPUおよび8 GB vCPUおよび16 GB vCPUおよび32 GB vCPUおよび64 GB RAM |
6 7 9 13 |
Decision Optimizationの展開 | 2vCPUおよび8 GB vCPUおよび16 GB vCPUおよび32 GB vCPUおよび64 GB RAM |
30 40 50 60 |
Machine Learningモデル トレーニング、評価、スコアリング) |
1vCPUおよび4 GB vCPUおよび8 GB vCPUおよび16 GB vCPUおよび32 GB vCPUおよび64 GB RAM |
0.5 1 2 4 8 |
Tuning Studio「 watsonx |
NVIDIA A100 80GBGPU | 43 |
デプロイメントおよびフレームワーク・タイプによる CUH の使用量
CUH 使用量は、以下の数式を使用して計算されます:
デプロイメント・タイプ | フレームワーク | CUH 計算 |
---|---|---|
オンライン | AutoAI, AI function、AIサービス、SPSS、Scikit-Learnカスタムライブラリ、Tensorflow、RShiny | deployment_active_duration_in_hours(展開時間) * no_of_nodes(ノード数) * CUH_rate_for_capacity_type_framework(キャパシティタイプ・フレームワークのためのCUHレート |
オンライン | Spark, PMML, Scikit-Learn, Pytorch, XGBoost | score_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework |
バッチ | すべてのフレームワーク | job_duration_in_hours * no_of_nodes * CUH_rate_for_capacity_type_framework |
たとえば、15分間実行されるDecision Optimizationバッチ展開ジョブを考えてみましょう。 リソースの消費量は次のように計算されます:15分=0.25時間、2ノード、2vCPU、8GB RAM。 この組み合わせの結果、CUHレートは30となり、ジョブが実行されるたびに0.25* 2 * 30、つまり15CUHが消費される。
これらの表は、事前に定義された機械学習環境について、使用タイプ別に1時間あたりの容量単位を計算したものである。
モデルをトレーニング、評価、またはスコアリングするために必要な 1 時間当たりのキャパシティー・ユニット
キャパシティー・タイプ | 1 時間当たりのキャパシティー・ユニット |
---|---|
エクストラ・スモール:1vCPU、4 GB RAM | 0.5 |
小型:2vCPU、8 GB RAM | 1 |
ミディアム:4vCPU、16 GB RAM | 2 |
ラージ:8vCPU、32GB RAM | 4 |
超大容量:16vCPU、64 GB RAM | 8 |
AutoAI エクスペリメントの 1 時間当たりのキャパシティー・ユニット
キャパシティー・タイプ | 1 時間当たりのキャパシティー・ユニット |
---|---|
8 vCPU および 32 GB RAM | 20 |
Decision Optimization実験における1時間当たりの容量単位
これらの計画は、watsonx.aiStudio で実行されるDecision Optimization実験に適用される。
キャパシティー・タイプ | 1 時間当たりのキャパシティー・ユニット |
---|---|
Decision Optimization: 2 個の vCPU および 8 GB の RAM | 6 |
Decision Optimization: 4 個の vCPU および 16 GB の RAM | 7 |
Decision Optimization:8vCPU、32 GB RAM | 9 |
Decision Optimization: 16 個の vCPU および 64 GB の RAM | ※13 |
watsonx.aiランタイムのDecision Optimizationにおける時間あたりの容量単位
これらのプランは、watsonx.aiRuntime からデプロイされ実行されるDecision Optimizationに適用されます。
キャパシティー・タイプ | 1 時間当たりのキャパシティー・ユニット |
---|---|
Decision Optimization: 2 個の vCPU および 8 GB の RAM | 30時間まで |
Decision Optimization: 4 個の vCPU および 16 GB の RAM | 40 |
Decision Optimization:8vCPU、32 GB RAM | 50 |
Decision Optimization: 16 個の vCPU および 64 GB の RAM | 60 |
リソース使用量のモニター
プロジェクトやスペースで所有または共同作業しているアセットのリソース使用状況を追跡できます。 アカウントの所有者または管理者であれば、アカウント全体のCUHを追跡できます。 詳細については、アカウント・リソースの使用状況の監視を参照してください。
IBM Cloudアカウントの所有者または管理者、またはwatsonx.aiランタイム・サービスの所有者であれば、Environment Runtimesページでアカウントのランタイム使用量を追跡できます。 詳細は、リソースの監視を参照。
ノートブックにおける機械学習のためのCUH消費量の追跡
ノートブックの容量単位時間を計算するには、次のようにする:
CP = client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)
次に例を示します。
'capacity_units': {'current': 19773430}
19773430/(3600*1000)
結果: 5.49 CUH
詳細については、IBM watsonx.aiRuntime APIドキュメントの Service Instances セクションを参照してください。
もっと見る
親トピック: watsonx.aiランタイムプラン