ジェネレーティブAI資産の請求詳細 | IBM Cloud Pak for Data as a Service

資料の英語版に戻る

ジェネレーティブAI資産の請求詳細

最終更新: 2024年12月05日

ジェネレーティブAI資産の請求詳細

ジェネレーティブAI資産の使用量が、リソース単位（RU）、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。

watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 IBM watsonx.aiの概要。

リソースの測定方法の詳細を確認する：

watsonx.aiが提供する基礎モデルの推論能力を測定するためのリソースユニット。
watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
ドキュメントのテキスト抽出のためのページ単位の定額料金。

基礎モデルの資源単位計量

対応基礎モデルのリストと価格については、対応基礎モデルを参照のこと。対応エンコーダーモデルのリストと価格については、対応エンコーダーモデルをご覧ください。

リソースユニット（RU）は、基礎モデルの推論の入力と出力から1000トークンに相当する。トークンとは、基礎モデルのプロンプトの入力または出力、あるいはエンベッディング・モデルへの入力に使用されるテキストの基本単位（通常は4文字または0.75語）である。

IBM watsonx.aiが提供する各基礎モデルには、入力と出力に対する推論価格が割り当てられている。価格は1RUの基本価格（00.0001ドル）の倍数として算出される。例えば、価格が00.0006ドルのモデルは、基本レートの6倍の倍率を持つ。

重要：モデルに送信される1秒あたりの推論リクエスト数には、プランによる制限があります。ユーザーが推論要求の上限を超えた場合、システム通知がガイダンスを提供する。

プロンプト・チューン・ファウンデーション・モデルは、基礎となるファウンデーション・モデルと同じ価格が割り当てられる。チューニングされたファンデーション・モデルについては、Tuning Studioを参照。 Tuning Studioでモデルをチューニングするには、キャパシティ・ユニット・アワー（CUH）を消費します。詳細については、機械学習資産の請求の詳細をご覧ください。

モデルごとのリソース単価の計算

基礎モデル推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。

基本的な計算式は以下の通り：

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

RUの基本価格は00.0001ドル。各基礎モデルの価格は、基本価格の倍数である。

倍率による請求クラス

watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます：

表 1. APIの価格段階
モデル価格	USDでのRUあたりの価格	倍率基準レート
クラス 1	$0.0006	6
クラス 2	$0.0018	18
クラス 3	$0.0050	50
クラスC1	$0.0001	1
クラス5	$0.00025	2.5
クラス7	$0.016	160
クラス8	$0.00015	1.5
クラス9	$0.00035	3.5
クラス10	$0.0020	20
クラス11	$0.000005	0.05
クラス12	$0.0002	2

注:

ミストラル・ラージなど一部のモデルには、倍率によらない特別価格が設定されている。価格はサポートモデルで表示されている。

カスタム・ファンデーション・モデルの1時間あたりの請求料金

カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。

課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。

表 2. カスタム・ファンデーション・モデルの請求料金
構成サイズ	1時間あたりの請求レート（米ドル
小	$5.22
中	$10.40
大	$20.85

重要：カスタム・ファンデーション・モデルは、アカウントごとに最大4つ（小）、2つ（中）、または1つ（大）まで配置できます。

カスタム基盤モデルの構成の選択に関する詳細は、カスタム基盤モデルの展開計画を参照してください。

オンデマンド・デプロイ・モデルの時間単位の請求料金

お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。配置へのアクセスを許可した同僚だけが、基礎モデルを推論できます。専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。

注：基礎モデルをオンデマンドで展開するには、スタンダードプランが必要です。この機能は現在、ダラスのデータセンターでのみ利用できる。

価格など、オンデマンドでの基盤モデルの展開に関する詳細は、 watsonx.aiで利用可能な基盤モデルをご覧ください。

文書テキスト抽出の1ページあたりの料金

watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。

請求は、処理されたページごとに定額で行われます。ページには、テキスト（1800文字まで）、画像、.tiffフレームを使用できます。請求料金はプランの種類によって異なります。

表 3. テキスト抽出価格
プラン・タイプ	ページあたりの価格（米ドル
必須	$0.038
Standard	$0.030

機械学習アセットの価格の詳細については、機械学習アセットの課金料金をご覧ください。
コンピューティング・リソースの割り当てと消費のトラッキングに関する詳細は、ランタイムの使用状況を参照してください。
各モデルの詳細については、対応するファンデーション・モデルを参照のこと。
各モデルの地域サポートについては、ファンデーションモデルの地域サポートを参照。

親トピック： watsonx.aiランタイムプラン