Watson Machine Learning のプランとコンピュート・リソースの使用

AutoAI モデルのトレーニング、ディープ・ラーニング・エクスペリメントの実行、デプロイ済みのモデルに対する予測の要求を行う際には、Watson Machine Learning のリソース (キャパシティー・ユニット時間単位 (CUH)) を使用します。 このトピックでは、選択できる各種プランおよび含まれているサービスについて説明します。また、ニーズに合ったプランを選択できるように、デフォルトのコンピューティング環境のリストを示します。 このトピックでは、以下について説明します。

キャパシティー・ユニット時間 (CUH)

CUH は、単位時間あたりの計算リソース消費量の尺度です。 すべての Watson Machine Learning プランは、キャパシティー・ユニット時間を中心に統合されており、リソース消費量を容易に追跡できるようになっています。

Watson Machine Learning のプラン

{: #wml-plan}Watson Machine Learning のプランにより、Watson Machine Learning でトレーニングおよびデプロイしたモデルに対する課金方法が決定します。 ニーズに合わせて、以下のプランを選択してください。

  • ライトは、容量が制限された無料プランです。 Watson Machine Learning を評価する目的で、機能を試す場合は、このプランを選択します。
  • 標準は従量課金 (PAYG) プランであり、ニーズに合わせてモデルを作成、デプロイ、および管理する柔軟性があります。
  • プロフェッショナルは、組織のすべての機械学習ニーズをサポートするように設計された、大容量のフラット・レート・エンタープライズ・プランです。 また、プロフェッショナル・プランでは、ダラス・リージョンにプロビジョンされている場合、HIPAA のサポートも提供されます。

プランの詳細と料金設定については、『IBM Cloud Machine Learning』を参照してください。

注: 標準からプロフェッショナルにアップグレードすると、標準プランにロールバックできません。 この場合は、IBM サポートに連絡してサポートを受けてください。

CUH 別のプラン

計画 キャパシティー・ユニット時間を含む 対象 スペースあたりの最大デプロイメント・ジョブ数
ライト 20 時間/月 超過は許可されません 100
Standard CUH 単位で請求 CUH 単位で請求 1000
Professional 2500 消費された追加 CUH ごとに課金 3000 (サポートを介した要求による増加)

デプロイメント・ジョブを保持するための制限とデフォルト (Watson Machine Learning)

Watson Machine Learning では、単一のデプロイメント・スペースごとに保持されるデプロイメント・ジョブの数に制限があります。 重要な点として、この更新では情報は失われませんが、デプロイメント・ジョブの実行時にユーザー・エクスペリエンスを変更する必要が生じる可能性があります。

制限を超えると、既存のジョブを削除するか計画をアップグレードするまで、新しいデプロイメント・ジョブを作成できなくなります。 新しい自動化により、お客様はプランの制限内に留まることができます。 デフォルトでは、ジョブ・メタデータは 30 日後に自動削除されます。 この値は、ジョブの作成時にオーバーライドできます。 『ジョブの管理』を参照してください。

Watson Machine Learning のコンピュート使用量および料金

注: 料金について詳しくは、『Watson Machine Learning: 価格設定』を参照してください。

CUH 使用量の詳細

  • 機械学習のコンピュート使用量は、アクティブな機械学習インスタンスによって使用されたキャパシティー・ユニット時間 (CUH) 数で計算されます。
  • 使用された時間当たりのキャパシティー・ユニットのレートは、Machine Learning 資産およびモデルのコンピューティング要件によって決まります。 例えば、複雑な大規模データ・セットを使用するモデルでは、シンプルな小規模データ・セットを使用するモデルよりも多くのトレーニング・リソースを使用します。 より多くの同時ユーザーおよび要求をサポートするようにデプロイメントをスケーリングすると、CUH 使用量も増加することに注意してください。
  • デプロイメントのリソース使用量に影響を与える変数が非常に多いため、CUH 使用量を分析するためにモデルとデプロイメントに対してテストを実行することをお勧めします。
  • コンピュート時間は、ミリ秒単位まで計算されます。 ただし、それぞれの固有の操作に対して最小でも 1 分が課せられます。 つまり、12 秒かかったトレーニング実行は、キャパシティー・ユニット時間の割り当てに対して 1 分として課金されます。一方、83.555 秒かかったトレーニング実行は、その計算された数値のままで課金されます。
  • オンライン・デプロイメントが容量単位を消費する方法は、フレームワークに基づいています。 一部のフレームワークでは、デプロイメント・スペースでデプロイメント資産がアクティブになっている時間数に対して CUH が課金されます。 例えば、1 日 24 時間、週 7 日間稼働するオンライン・デプロイメント・モードの SPSS モデルは、CUH を消費し、その期間に対して課金されます。 アクティブなオンライン・デプロイメントのアイドル時間はありません。 その他のフレームワークの場合、CUH はスコアリング時間に従って課金されます。 CUH の計算方法について詳しくは、CUH 使用量の表を参照してください。

デプロイメントがアクティブかどうかの判別

デプロイメントが特定の期間に対するスコアリング要求を受信しない場合、そのデプロイメントは非アクティブまたはアイドルとして扱われ、SPSS 以外のすべてのフレームワークで請求処理が停止します。 デプロイメントが非アクティブになる時期を判別するために使用される期間は、プラン・タイプによって異なります。

計画のタイプ アイドル時間
ライト 1 日
Standard 3 日
Professional 3 日

デプロイメントおよびフレームワーク・タイプごとの CUH 使用量

CUH 使用量は、以下の数式を使用して計算されます。

デプロイメント・タイプ フレームワーク CUH 計算
Online AutoAI、AI 機能、SPSS、Scikit-Learn カスタム・ライブラリー、Tensorflow、RShiny deployment_active_duration no_of_nodes CUH_rate_for_capacity_type_framework
Online Spark、PMML、Scikit-Learn、Pytorch、XGBoost score_duration_in_seconds no_of_nodes CUH_rate_for_capacity_type_framework
バッチ すべてのフレームワーク job_duration_in_seconds no_of_nodes CUH_rate_for_capacity_type_framework

以下の表では、使用タイプごとに、機械学習環境の 1 時間当たりのキャパシティー・ユニットの計算を示します。

ディープ・ラーニング・エクスペリメントの 1 時間当たりのキャパシティー・ユニット

キャパシティー・タイプ 1 時間ごとのキャパシティー・ユニット
1 NVIDIA K80 GPU 2
1 NVIDIA V100 GPU 10

モデルをトレーニング、評価、またはスコアリングするために必要な 1 時間当たりのキャパシティー・ユニット

キャパシティー・タイプ 1 時間ごとのキャパシティー・ユニット
極小: 1x4 = 1 個の vCPU および 4 GB の RAM 0.5
小: 2x8 = 2 個の vCPU および 8 GB の RAM 1
中: 4x16 = 4 個の vCPU および 16 GB の RAM 2
大: 8x32 = 8 個の vCPU および 32 GB の RAM 4
特大: 16x64 = 16 個の vCPU および 64 GB の RAM 8

AutoAI エクスペリメントの 1 時間当たりのキャパシティー・ユニット

AutoAI エクスペリメント用にデータを結合する場合、1 時間当たりのキャパシティー・ユニットは、データの結合時に異なる方法で計算されます。 データが結合されると、CUH 消費量は、単一のデータ・ソースを使用するエクスペリメントの計算に戻ります。

単一のデータ・ソースを使用する AutoAI エクスペリメントの 1 時間当たりのキャパシティー・ユニット:

キャパシティー・タイプ 1 時間ごとのキャパシティー・ユニット
8 vCPU および 32 GB RAM 20

データの結合中の AutoAI エクスペリメントの 1 時間当たりのキャパシティー・ユニット数:

実行プログラムを追加するたびに消費量が増加するので注意してください。

キャパシティー・タイプ 1 時間ごとのキャパシティー・ユニット
1 ドライバー: 2 vCPU および 8 GB RAM + 1 実行プログラム: 2 vCPU および 8 GB RAM と結合 10
追加の実行プログラムと結合 追加の実行プログラムごとに 5 CUH を追加
データ結合後: 8 vCPU および 32 GB RAM 20

Decision Optimization の 1 時間当たりのキャパシティー・ユニット

キャパシティー・タイプ 1 時間ごとのキャパシティー・ユニット
Decision Optimization: 2 vCPU および 8 GB RAM 30
Decision Optimization: 4 vCPU および 16 GB RAM 40
Decision Optimization: 16 vCPU および 64 GB RAM 60

リソースの消費方法について詳しくは、『アカウント・リソース使用量のモニタリング』を参照してください。

アカウントの CUH 使用量の追跡

IBM Cloud アカウント所有者または管理者、あるいは Watson Machine Learning サービス所有者は、「環境ランタイム」ページでアカウントのランタイム使用量をトラッキングできます。 詳しくは、『リソースのモニタリング』を参照してください。

ノートブックでの機械学習における CUH 消費量の追跡

キャパシティー・ユニット時間を計算するには、以下を使用します。

CP =  client.service_instance.get_details()
CUH = CUH["entity"]["usage"]["capacity_units"]["current"]/(3600*1000)
print(CUH)

例:

'capacity_units': {'current': 19773430}

19773430/(3600*1000)

結果: 5.49 CUH

詳しくは、IBM Watson Machine Learning API 資料の「サービス・インスタンス」セクションを参照してください。

詳細情報

親トピック: Watson Machine Learning