ジェネレーティブAI資産の請求詳細
ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。
watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 IBM watsonx.aiの概要。
リソースの測定方法の詳細を確認する:
- Resource units to measure inferencing activities for foundation models provided by watsonx.ai.
- watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
- 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
- ドキュメントのテキスト抽出のためのページ単位の定額料金。
リソース単位は、以下のリソースを測定するために使用されます
- 基盤モデルを推論してテキストまたはテキスト埋め込みを生成するために使用されるトークン。
- 基盤モデルが将来の値を予測するために使用するデータポイント。
基盤モデルの推論のためのリソース単位の計測
対応基礎モデルのリストと価格については、対応基礎モデルを参照のこと。 対応エンコーダーモデルのリストと価格については、対応エンコーダーモデルをご覧ください。
基盤モデルの測定では、リソース単位(RU)は、 基盤モデルから1,000トークンに相当します。 トークンとは、基礎モデルのプロンプトの入力または出力、あるいはエンベッディング・モデルへの入力に使用されるテキストの基本単位(通常は4文字または0.75語)である。
IBM watsonx.aiが提供する各基礎モデルには、入力と出力に対する推論価格が割り当てられている。 価格は1RUの基本価格(00.0001ドル)の倍数として算出される。 例えば、価格が00.0006ドルのモデルは、基本レートの6倍の倍率を持つ。
プロンプト・チューン・ファウンデーション・モデルは、基礎となるファウンデーション・モデルと同じ価格が割り当てられる。 チューニングされたファンデーション・モデルについては、Tuning Studioを参照。 Tuning Studioでモデルをチューニングするには、キャパシティ・ユニット・アワー(CUH)を消費します。 詳細については、機械学習資産の請求の詳細をご覧ください。
時系列基盤モデルの推論のためのリソース単位の計測
基盤モデル予測を測定する場合、リソース・ユニット(RU)は、 基盤モデルと出力における1,000のデータポイントに相当します。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。
倍率による請求クラス
watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:
モデル価格 | リソース・タイプ | USDでのRUあたりの価格 | 倍率 基準レート |
---|---|---|---|
クラス 1 | トークン | $0.0006 | 6 |
クラス 2 | トークン | $0.0018 | 18 |
クラス 3 | トークン | $0.0050 | 50 |
クラスC1 | トークン | $0.0001 | 1 |
クラス5 | トークン | $0.00025 | 2.5 |
クラス7 | トークン | $0.016 | 160 |
クラス8 | トークン | $0.00015 | 1.5 |
クラス9 | トークン | $0.00035 | 3.5 |
クラス10 | トークン | $0.0020 | 20 |
クラス11 | トークン | $0.000005 | 0.05 |
クラス12 | トークン | $0.0002 | 2 |
第13類 | トークン | $0.00071 | 7.1 |
クラス14 | データ・ポイント数 | $0.00013 | 1.3 |
第15類 | データ・ポイント数 | $0.00038 | 3.8 |
ミストラル・ラージなど一部のモデルには、倍率によらない特別価格が設定されている。 価格はサポートモデルで表示されている。
モデルごとのトークンのリソース単位レートを計算する
基礎モデル推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。 合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。
基本的な計算式は以下の通り:
Total tokens used/1000 = Resource Units (RU) consumed RU consumed x model price = Total usage charge
RUの基本価格は00.0001ドル。 各基礎モデルの価格は、基本価格の倍数である。
モデルごとのデータポイントのリソース単位レートを計算する
基盤モデルによる予測料金を計算するには、以下の式を使用します
- 入力計算:
context length x number of series x number of channels
- 出力計算:
prediction length x number of series x number of channels
これらの方程式では、以下のパラメータを使用します
- 文脈の長さ refers to the number of historical data points that a time series foundation model uses as input to make predictions.
- シリーズとは、時系列で順次行われた観測の集まりである。 例えば、多くの企業の株価を比較する場合、各企業の観察された株価の履歴は別々の系列となります。
- チャンネルとは、時系列データセット内で測定される特定の特性または変数です。
- 予測長とは、モデルが予測する将来のデータポイントの数を指します。
リソース・タイプ | モデル価格 | RUあたりの米ドル価格 |
---|---|---|
入力データポイント | クラス14 | $0.00013 |
出力データポイント | 第15類 | $0.00038 |
次の例は、以下のパラメータを使用した時系列予測リクエストのコストの計算方法を示しています
パラメーター | 数量例 |
---|---|
文脈の長さ( granite-ttm-1536-96-r2 モデル) | 1,536 |
チャネル | 10 |
系列 | 1.000 |
予測長 | 96 |
総入力データポイント:15,360,000(文脈長1,536、10チャンネル、1,000シリーズ用)
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
総出力データポイント:960,000(予測96時点、10チャンネル、1,000シリーズ)
960,000 / 1,000 = 960 x 0.00038 = 0.3648
時系列予測リクエストの合計価格:$ 2.36 (入力コスト$ 1.9968 + 出力コスト$ 0.3648 )
1.9968 + 0.3648 = 2.3616
カスタム・ファンデーション・モデルの1時間あたりの請求料金
カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。
課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。
構成サイズ | 1時間あたりの請求レート(米ドル |
---|---|
小 | $5.22 |
中 | $10.40 |
大 | $20.85 |
カスタム基盤モデルの構成の選択に関する詳細は、カスタム基盤モデルの展開計画を参照してください。
オンデマンド・デプロイ・モデルの時間単位の請求料金
お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 配置へのアクセスを許可した同僚だけが、基礎モデルを推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。
For details on on deploying a foundation model on demand, including pricing, see Supported foundation models in watsonx.ai.
文書テキスト抽出の1ページあたりの料金
watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。
請求は、処理されたページごとに定額で行われます。 ページには、テキスト(1800文字まで)、画像、.tiffフレームを使用できます。 請求料金はプランの種類によって異なります。
プラン・タイプ | ページあたりの価格(米ドル |
---|---|
必須 | $0.038 |
Standard | $0.030 |
もっと見る
- 機械学習アセットの価格の詳細については、機械学習アセットの課金料金をご覧ください。
- コンピューティングリソースの割り当てと消費の追跡の詳細については 、「ランタイムの使用状況」 を参照してください。
- 各モデルの詳細については 、「サポート対象の基礎モデル 」を参照してください。
- 各モデルの地域サポートの詳細については、 基礎モデルの地域別提供状況をご覧ください。
親トピック: watsonx.aiランタイムプラン