資料の 英語版 に戻る

ジェネレーティブAI資産の請求詳細

最終更新: 2025年2月14日
ジェネレーティブAI資産の請求詳細

ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。

watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 IBM watsonx.aiの概要

リソースの測定方法の詳細を確認する:

  • Resource units to measure inferencing activities for foundation models provided by watsonx.ai.
  • watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
  • 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
  • ドキュメントのテキスト抽出のためのページ単位の定額料金。

リソース単位は、以下のリソースを測定するために使用されます

  • 基盤モデルを推論してテキストまたはテキスト埋め込みを生成するために使用されるトークン。
  • 基盤モデルが将来の値を予測するために使用するデータポイント。

基盤モデルの推論のためのリソース単位の計測

対応基礎モデルのリストと価格については、対応基礎モデルを参照のこと。 対応エンコーダーモデルのリストと価格については、対応エンコーダーモデルをご覧ください。

基盤モデルの測定では、リソース単位(RU)は、 基盤モデルから1,000トークンに相当します。 トークンとは、基礎モデルのプロンプトの入力または出力、あるいはエンベッディング・モデルへの入力に使用されるテキストの基本単位(通常は4文字または0.75語)である。

IBM watsonx.aiが提供する各基礎モデルには、入力と出力に対する推論価格が割り当てられている。 価格は1RUの基本価格(00.0001ドル)の倍数として算出される。 例えば、価格が00.0006ドルのモデルは、基本レートの6倍の倍率を持つ。

重要:モデルに送信される1秒あたりの推論リクエスト数には、プランによる制限があります。 ユーザーが推論要求の上限を超えた場合、システム通知がガイダンスを提供する。

プロンプト・チューン・ファウンデーション・モデルは、基礎となるファウンデーション・モデルと同じ価格が割り当てられる。 チューニングされたファンデーション・モデルについては、Tuning Studioを参照。 Tuning Studioでモデルをチューニングするには、キャパシティ・ユニット・アワー(CUH)を消費します。 詳細については、機械学習資産の請求の詳細をご覧ください。

時系列基盤モデルの推論のためのリソース単位の計測

基盤モデル予測を測定する場合、リソース・ユニット(RU)は、 基盤モデルと出力における1,000のデータポイントに相当します。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。

倍率による請求クラス

watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:

表 1. APIの価格段階
モデル価格 リソース・タイプ USDでのRUあたりの価格 倍率
基準レート
クラス 1 トークン $0.0006 6
クラス 2 トークン $0.0018 18
クラス 3 トークン $0.0050 50
クラスC1 トークン $0.0001 1
クラス5 トークン $0.00025 2.5
クラス7 トークン $0.016 160
クラス8 トークン $0.00015 1.5
クラス9 トークン $0.00035 3.5
クラス10 トークン $0.0020 20
クラス11 トークン $0.000005 0.05
クラス12 トークン $0.0002 2
第13類 トークン $0.00071 7.1
クラス14 データ・ポイント数 $0.00013 1.3
第15類 データ・ポイント数 $0.00038 3.8
注:

ミストラル・ラージなど一部のモデルには、倍率によらない特別価格が設定されている。 価格はサポートモデルで表示されている。

モデルごとのトークンのリソース単位レートを計算する

基礎モデル推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。 合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。

基本的な計算式は以下の通り:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

RUの基本価格は00.0001ドル。 各基礎モデルの価格は、基本価格の倍数である。

モデルごとのデータポイントのリソース単位レートを計算する

基盤モデルによる予測料金を計算するには、以下の式を使用します

  • 入力計算: context length x number of series x number of channels
  • 出力計算: prediction length x number of series x number of channels

これらの方程式では、以下のパラメータを使用します

  • 文脈の長さ refers to the number of historical data points that a time series foundation model uses as input to make predictions.
  • シリーズとは、時系列で順次行われた観測の集まりである。 例えば、多くの企業の株価を比較する場合、各企業の観察された株価の履歴は別々の系列となります。
  • チャンネルとは、時系列データセット内で測定される特定の特性または変数です。
  • 予測長とは、モデルが予測する将来のデータポイントの数を指します。
データポイント価格設定
リソース・タイプ モデル価格 RUあたりの米ドル価格
入力データポイント クラス14 $0.00013
出力データポイント 第15類 $0.00038

次の例は、以下のパラメータを使用した時系列予測リクエストのコストの計算方法を示しています

データポイントの使用量を計算するために使用されるパラメータ
パラメーター 数量例
文脈の長さ( granite-ttm-1536-96-r2 モデル) 1,536
チャネル 10
系列 1.000
予測長 96
  • 総入力データポイント:15,360,000(文脈長1,536、10チャンネル、1,000シリーズ用)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • 総出力データポイント:960,000(予測96時点、10チャンネル、1,000シリーズ)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • 時系列予測リクエストの合計価格:$ 2.36 (入力コスト$ 1.9968 + 出力コスト$ 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

カスタム・ファンデーション・モデルの1時間あたりの請求料金

カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。

課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。

カスタム・ファンデーション・モデルの請求料金
構成サイズ 1時間あたりの請求レート(米ドル
$5.22
$10.40
$20.85
重要:カスタム・ファンデーション・モデルは、アカウントごとに最大4つ(小)、2つ(中)、または1つ(大)まで配置できます。

カスタム基盤モデルの構成の選択に関する詳細は、カスタム基盤モデルの展開計画を参照してください。

オンデマンド・デプロイ・モデルの時間単位の請求料金

お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 配置へのアクセスを許可した同僚だけが、基礎モデルを推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。

注:基礎モデルをオンデマンドで展開するには、スタンダードプランが必要です。

For details on on deploying a foundation model on demand, including pricing, see Supported foundation models in watsonx.ai.

文書テキスト抽出の1ページあたりの料金

watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。

請求は、処理されたページごとに定額で行われます。 ページには、テキスト(1800文字まで)、画像、.tiffフレームを使用できます。 請求料金はプランの種類によって異なります。

テキスト抽出価格
プラン・タイプ ページあたりの価格(米ドル
必須 $0.038
Standard $0.030

もっと見る

親トピック: watsonx.aiランタイムプラン