0 / 0

ジェネレーティブAI資産の請求詳細

最終更新: 2025年7月03日
ジェネレーティブAI資産の請求詳細

ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。

watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 watsonx.aiの詳細については、 IBM watsonx.aiの概要を参照のこと。

リソースの測定方法の詳細を確認する:

  • watsonx.ai が提供する基盤モデルモデルの推論活動を測定するためのリソースユニット。
  • watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
  • 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
  • ドキュメントのテキスト抽出は1ページあたりの定額料金です。

リソース単位は、以下のリソースを測定するために使用されます

  • テキストまたはテキスト埋め込みを生成するための基盤モデル推論に使用されるトークン。
  • 時系列基盤モデルモデルが将来の値を予測するために使用するデータポイント。

推論基盤モデル請求料金 IBM

基盤モデル推論または予測は、 基盤モデル入力と出力、またはエンコーダモデルの出力に使用されるトークン、データポイント、または文字を追跡することによって測定されます。 トークンとは、テキストの基本単位(通常4文字または 0.75 語)である。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。

課金レートの詳細については、 IBM Cloud でのモデルごとのトークン使用量の計算」を参照してください。

課金レートの詳細については、 「 AWS でのモデルごとのトークン使用量の計算」を参照してください。

重要:モデルに送信される1秒あたりの推論リクエスト数には、プランによる制限があります。 ユーザーが推論要求の上限を超えた場合、システム通知がガイダンスを提供する。

For the list of supported foundation models for generating text and their prices, see サポートされている基盤モデル. テキスト埋め込みの再ランク付けと生成にサポートされているエンコーダー モデルとその価格のリストについては、 「サポートされているエンコーダー モデル」 を参照してください。

基盤モデル、基礎となる基盤モデル モデルと同じ価格が割り当てられる。 同調基盤モデルTuning Studio. Tuning Studio でモデルをチューニングすると、キャパシティ・ユニット・アワー(CUH)を消費する。 詳細については、機械学習資産の請求の詳細をご覧ください。

時系列基盤モデル推論の課金率

基盤モデル予測を測定する場合、1リソースユニット(RU)は、 基盤モデル入力と出力における1,000データポイントに相当する。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。

AWS、 基盤モデル使用量を測定する場合、データ点数は1000点単位でカウントされる。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。 バッチ総数は、モデル固有の乗数でスケーリングされる。 リソース・ユニット(RU)は、このようなバッチ1万個に相当する。

倍率による請求クラス

watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:

表 1. APIの価格段階
モデル価格 リソース・タイプ USDでのRUあたりの価格
( IBM Cloud )
乗数
クラス 1 トークン $0.0006 6
クラス 2 トークン $0.0018 18
クラス 3 トークン $0.0050 50
クラスC1 トークン $0.0001 1
クラス5 トークン $0.00025 2.5
クラス7 トークン $0.016 160
クラス8 トークン $0.00015 1.5
クラス9 トークン $0.00035 3.5
クラス10 トークン $0.0020 20
クラス11 トークン $0.000005 0.05
クラス12 トークン $0.0002 2
第13類 トークン $0.00071 7.1
クラス14 データ・ポイント数 $0.00013 1.3
第15類 データ・ポイント数 $0.00038 3.8
クラス16 トークン $0.0014 14
クラス17 トークン $0.0003 3
注:

Mistral Largeなど一部のモデルには、倍率によらない特別価格が設定されている。 価格は 対応基盤モデル に記載されている。

モデルごとのトークン使用率を計算する IBM Cloud

基盤モデル推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割 り、1000未満を切り上げて、リソース・ユニット(RU)の合計数を算出する。 RUの合計数にモデル固有のマルチプラーを掛け合わせ、利用料金の合計を求める。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。

基本的な計算式は以下の通り:

Total tokens used/1000 = Resource Units (RU) consumed
RUs consumed x base price per RU x model multiplier = Total usage charge

RUの基本価格は00.0001ドル。 基盤モデル価格は、基本価格の倍数である。

モデルごとのトークン使用率を計算する AWS

基盤モデル推論の料金を計算するには、消費されたトークンの総数を1000で割り、1000未満を切り上げ て、消費されたトークンのバッチ数を求める。 消費バッチ数にモデル固有の乗数を乗じ、総バッチ数を求める。 バッチ総数を10,000で割って、RUの総数を求める。

基本的な計算式は以下の通り:

Total tokens used/1000 = Batches of tokens consumed
Batches of tokens consumed x model multiplier = Total number of token batches
Total number of token batches / 10,000 = Resource Units (RUs) measured

使用するケースに必要なRUを購入する。

モデルごとのデータポイントのリソース単位レートを計算する

時系列基盤モデル予測の料金を計算するには、以下の式を使用する:

  • 入力計算: context length x number of series x number of channels
  • 出力計算: prediction length x number of series x number of channels

これらの方程式では、以下のパラメータを使用します

  • コンテキストの長さとは、時系列基盤モデルモデルが予測を行うために入力として使用する過去のデータポイントの数を指す。
  • シリーズとは、時系列で順次行われた観測の集まりである。 例えば、多くの企業の株価を比較する場合、各企業の観察された株価の履歴は別々の系列となります。
  • チャンネルとは、時系列データセット内で測定される特定の特性または変数です。
  • 予測長とは、モデルが予測する将来のデータポイントの数を指します。

これらの値の詳細については 、「将来のデータ値の予測」 を参照してください。

データポイント価格設定
リソース・タイプ モデル価格 価格:USD/RU
( IBM Cloud )
入力データポイント クラス14 $0.00013
出力データポイント 第15類 $0.00038

次の例は、以下のパラメータを使用した時系列予測リクエストのコストの計算方法を示しています

データポイントの使用量を計算するために使用されるパラメータ
パラメーター 数量例
文脈の長さ( granite-ttm-1536-96-r2 モデル) 1,536
チャネル 10
系列 1.000
予測長 96
  • 総入力データポイント:15,360,000(文脈長1,536、10チャンネル、1,000シリーズ用)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • 総出力データポイント:960,000(予測96時点、10チャンネル、1,000シリーズ用)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • 時系列予測リクエストの合計価格:$ 2.36 (入力コスト$ 1.9968 + 出力コスト$ 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

カスタム・ファンデーション・モデルの1時間あたりの請求料金

カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。

課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。

カスタム・ 基盤モデル請求料金
構成サイズ 1時間あたりの請求レート(米ドル
$5.22
中間 $10.40
$20.85
重要:カスタム・ファンデーション・モデルは、アカウントごとに最大4つ(小)、2つ(中)、または1つ(大)まで配置できます。

カスタム・ 基盤モデルコンフィギュレーションの選択に関する詳細は、 カスタム・ 基盤モデル導入計画 を参照。

オンデマンド・デプロイ・モデルの時間単位の請求料金

お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 デプロイメントアクセスを許可した同僚だけが、 基盤モデル推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。

注:基礎モデルをオンデマンドで展開するには、スタンダードプランが必要です。

価格など、オンデマンドでの基盤モデルデプロイに関する詳細は、 対応基盤モデル をご覧ください。

文書テキスト抽出の1ページあたりの料金

watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。 詳しくは、文書からテキストを抽出するを参照してください。

ページには、テキスト(3000文字まで)、画像、.tiffフレームを使用できます。

課金は、処理されたページごとに定額で行われ、課金率はお客様の IBM Cloud プランタイプによって異なります。

テキスト抽出価格
プラン・タイプ ページあたりの価格(米ドル
必須 $0.038
標準 $0.030

使用量は消費されたリソース単位(RU)で測定される。 33ページの文書を処理するには1RUを使用する。

詳細情報

親トピック: サービスと統合