ジェネレーティブAI資産の請求詳細

最終更新: 2025年2月13日
ジェネレーティブAI資産の請求詳細

ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。

watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 watsonx.aiの詳細については、 IBM watsonx.aiの概要を参照のこと。

リソースの測定方法の詳細を確認する:

  • Resource units to measure inferencing activities for foundation models provided by watsonx.ai.
  • watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
  • 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
  • ドキュメントのテキスト抽出のためのページ単位の定額料金。

リソース単位は、以下のリソースを測定するために使用されます

  • foundation model を推論してテキストまたはテキスト埋め込みを生成するために使用されるトークン。
  • 時系列分析で将来の値を予測するために使用されるデータポイント。 foundation model

基盤モデルの推論のためのリソース単位の計測

For the list of supported foundation models for generating text and their prices, see サポートされている基盤モデル. テキスト埋め込みの再ランク付けと生成にサポートされているエンコーダー モデルとその価格のリストについては、 「サポートされているエンコーダー モデル」 を参照してください。

foundation model の推論を測定する場合、リソースユニット(RU)は、 foundation model の入力と出力から1,000トークンに相当します。 トークンとは、 foundation model プロンプトの入力または出力、または埋め込みモデルへの入力で使用されるテキストの基本単位(通常は4文字または 0.75 語)です。

IBM watsonx.aiが提供するfoundation modelには、入力と出力に対する推論価格が割り当てられている。 価格は1RUの基本価格(00.0001ドル)の倍数として算出される。 例えば、価格が00.0006ドルのモデルは、基本レートの6倍の倍率を持つ。

重要:モデルに送信される1秒あたりの推論リクエスト数には、プランによる制限があります。 ユーザーが推論要求の上限を超えた場合、システム通知がガイダンスを提供する。

迅速に調整されたfoundation modelは、基礎foundation modelと同じ価格が割り当てられる。 チューニングされたファンデーション・モデルについては、Tuning Studioを参照。 Tuning Studioでモデルをチューニングするには、キャパシティ・ユニット・アワー(CUH)を消費します。 詳細については、機械学習資産の請求の詳細をご覧ください。

時系列基盤モデルの推論のためのリソース単位の計測

foundation model の予測を測定する場合、リソースユニット(RU)は、 foundation model の入出力における1,000のデータポイントに相当します。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。

倍率による請求クラス

watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:

表 1. APIの価格段階
モデル価格 リソース・タイプ USDでのRUあたりの価格 倍率
基準レート
クラス 1 トークン $0.0006 6
クラス 2 トークン $0.0018 18
クラス 3 トークン $0.0050 50
クラスC1 トークン $0.0001 1
クラス5 トークン $0.00025 2.5
クラス7 トークン $0.016 160
クラス8 トークン $0.00015 1.5
クラス9 トークン $0.00035 3.5
クラス10 トークン $0.0020 20
クラス11 トークン $0.000005 0.05
クラス12 トークン $0.0002 2
第13類 トークン $0.00071 7.1
クラス14 データ・ポイント数 $0.00013 1.3
第15類 データ・ポイント数 $0.00038 3.8
注:

Mistral Largeなど一部のモデルには、倍率によらない特別価格が設定されている。 価格はサポートモデルで表示されている。

モデルごとのトークンのリソース単位レートを計算する

foundation model推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。 合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。

基本的な計算式は以下の通り:

Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge

RUの基本価格は00.0001ドル。 foundation modelの価格は、基本価格の倍数である。

モデルごとのデータポイントのリソース単位レートを計算する

時系列予測の料金を計算するには、 foundation model 、次の式を使用します

  • 入力計算: context length x number of series x number of channels
  • 出力計算: prediction length x number of series x number of channels

これらの方程式では、以下のパラメータを使用します

  • 文脈の長さ foundation model が予測を行う際に使用する入力値として、時系列が参照する過去のデータポイントの数を指します。
  • シリーズとは、時系列で順次行われた観測の集まりである。 例えば、多くの企業の株価を比較する場合、各企業の観察された株価の履歴は別々の系列となります。
  • チャンネルとは、時系列データセット内で測定される特定の特性または変数です。
  • 予測長とは、モデルが予測する将来のデータポイントの数を指します。

これらの値の詳細については 、「将来のデータ値の予測」 を参照してください。

データポイント価格設定
リソース・タイプ モデル価格 RUあたりの米ドル価格
入力データポイント クラス14 $0.00013
出力データポイント 第15類 $0.00038

次の例は、以下のパラメータを使用した時系列予測リクエストのコストの計算方法を示しています

データポイントの使用量を計算するために使用されるパラメータ
パラメーター 数量例
文脈の長さ( granite-ttm-1536-96-r2 モデル) 1,536
チャネル 10
系列 1.000
予測長 96
  • 総入力データポイント:15,360,000(文脈長1,536、10チャンネル、1,000シリーズ用)

    15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
    
  • 総出力データポイント:960,000(予測96時点、10チャンネル、1,000シリーズ用)

    960,000 / 1,000 = 960 x 0.00038 = 0.3648
    
  • 時系列予測リクエストの合計価格:$ 2.36 (入力コスト$ 1.9968 + 出力コスト$ 0.3648 )

    1.9968 + 0.3648 = 2.3616
    

カスタム・ファンデーション・モデルの1時間あたりの請求料金

カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。

課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。

カスタム・foundation modelの請求料金
構成サイズ 1時間あたりの請求レート(米ドル
$5.22
中間 $10.40
$20.85
重要:カスタム・ファンデーション・モデルは、アカウントごとに最大4つ(小)、2つ(中)、または1つ(大)まで配置できます。

カスタムfoundation modelの構成の選択に関する詳細は、カスタムfoundation modelの展開計画を参照してください。

オンデマンド・デプロイ・モデルの時間単位の請求料金

お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 配置へのアクセスを許可した同僚だけが、foundation modelを推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。

注:基礎モデルをオンデマンドで展開するには、スタンダードプランが必要です。

foundation model on demandの導入に関する詳細(価格を含む)については、 Supported foundation models in watsonx.ai をご覧ください。

文書テキスト抽出の1ページあたりの料金

watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。 詳しくは、文書からテキストを抽出するを参照してください。

請求は、処理されたページごとに定額で行われます。 ページには、テキスト(1800文字まで)、画像、.tiffフレームを使用できます。 請求料金はプランの種類によって異なります。

テキスト抽出価格
プラン・タイプ ページあたりの価格(米ドル
必須 $0.038
標準 $0.030

詳細情報

親トピック: watsonx.aiランタイムプラン