ジェネレーティブAI資産の請求詳細
ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。
watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 watsonx.aiの詳細については、 IBM watsonx.aiの概要を参照のこと。
リソースの測定方法の詳細を確認する:
- watsonx.ai が提供する基盤モデルモデルの推論活動を測定するためのリソースユニット。
- watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
- 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
- ドキュメントのテキスト抽出は1ページあたりの定額料金です。
リソース単位は、以下のリソースを測定するために使用されます
- テキストまたはテキスト埋め込みを生成するための基盤モデル推論に使用されるトークン。
- 時系列基盤モデルモデルが将来の値を予測するために使用するデータポイント。
基盤モデルの推論のためのリソース単位の計測
For the list of supported foundation models for generating text and their prices, see サポートされている基盤モデル. テキスト埋め込みの再ランク付けと生成にサポートされているエンコーダー モデルとその価格のリストについては、 「サポートされているエンコーダー モデル」 を参照してください。
基盤モデル推論を測定する場合、1リソースユニット(RU)は、 基盤モデルモデルの入力と出力から1,000トークンに相当する。 トークンとは、 基盤モデルプロンプトの入力または出力、あるいはエンベッディング・モデルへの入力に使用されるテキストの基本単位(通常は4文字または 0.75 語)である。
IBM watsonx.ai によって提供される基盤モデル、インプットとアウトプットの推論価格が割り当てられている。 価格は、RUの基本価格($ 0.0001 )の倍数として算出される。 例えば、価格が$ 0.0006 のモデルは、基本レートの6倍の倍率となる。
基盤モデル、基礎となる基盤モデル モデルと同じ価格が割り当てられる。 同調基盤モデルTuning Studio. Tuning Studio でモデルをチューニングすると、キャパシティ・ユニット・アワー(CUH)を消費する。 詳細については、機械学習資産の請求の詳細をご覧ください。
時系列基盤モデルの推論のためのリソース単位の計測
基盤モデル予測を測定する場合、1リソースユニット(RU)は、 基盤モデル入力と出力における1,000データポイントに相当する。 データポイントとは、1つまたは複数の数値で表される入力および出力コンテンツの単位です。
倍率による請求クラス
watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:
モデル価格 | リソース・タイプ | USDでのRUあたりの価格 | 倍率 基準レート |
---|---|---|---|
クラス 1 | トークン | $0.0006 | 6 |
クラス 2 | トークン | $0.0018 | 18 |
クラス 3 | トークン | $0.0050 | 50 |
クラスC1 | トークン | $0.0001 | 1 |
クラス5 | トークン | $0.00025 | 2.5 |
クラス7 | トークン | $0.016 | 160 |
クラス8 | トークン | $0.00015 | 1.5 |
クラス9 | トークン | $0.00035 | 3.5 |
クラス10 | トークン | $0.0020 | 20 |
クラス11 | トークン | $0.000005 | 0.05 |
クラス12 | トークン | $0.0002 | 2 |
第13類 | トークン | $0.00071 | 7.1 |
クラス14 | データ・ポイント数 | $0.00013 | 1.3 |
第15類 | データ・ポイント数 | $0.00038 | 3.8 |
Mistral Largeなど一部のモデルには、倍率によらない特別価格が設定されている。 価格はサポートモデルで表示されている。
モデルごとのトークンのリソース単位レートを計算する
基盤モデル推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。 合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。
基本的な計算式は以下の通り:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
RUの基本価格は00.0001ドル。 基盤モデル価格は、基本価格の倍数である。
モデルごとのデータポイントのリソース単位レートを計算する
時系列基盤モデル予測の料金を計算するには、以下の式を使用する:
- 入力計算:
context length x number of series x number of channels
- 出力計算:
prediction length x number of series x number of channels
これらの方程式では、以下のパラメータを使用します
- コンテキストの長さとは、時系列基盤モデルモデルが予測を行うために入力として使用する過去のデータポイントの数を指す。
- シリーズとは、時系列で順次行われた観測の集まりである。 例えば、多くの企業の株価を比較する場合、各企業の観察された株価の履歴は別々の系列となります。
- チャンネルとは、時系列データセット内で測定される特定の特性または変数です。
- 予測長とは、モデルが予測する将来のデータポイントの数を指します。
これらの値の詳細については 、「将来のデータ値の予測」 を参照してください。
リソース・タイプ | モデル価格 | RUあたりの米ドル価格 |
---|---|---|
入力データポイント | クラス14 | $0.00013 |
出力データポイント | 第15類 | $0.00038 |
次の例は、以下のパラメータを使用した時系列予測リクエストのコストの計算方法を示しています
パラメーター | 数量例 |
---|---|
文脈の長さ( granite-ttm-1536-96-r2 モデル) | 1,536 |
チャネル | 10 |
系列 | 1.000 |
予測長 | 96 |
総入力データポイント:15,360,000(文脈長1,536、10チャンネル、1,000シリーズ用)
15,360,000 / 1,000 = 15,360 x 0.00013 = 1.9968
総出力データポイント:960,000(予測96時点、10チャンネル、1,000シリーズ用)
960,000 / 1,000 = 960 x 0.00038 = 0.3648
時系列予測リクエストの合計価格:$ 2.36 (入力コスト$ 1.9968 + 出力コスト$ 0.3648 )
1.9968 + 0.3648 = 2.3616
カスタム・ファンデーション・モデルの1時間あたりの請求料金
カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。
課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。
構成サイズ | 1時間あたりの請求レート(米ドル |
---|---|
小 | $5.22 |
中間 | $10.40 |
大 | $20.85 |
カスタム・ 基盤モデルコンフィギュレーションの選択に関する詳細は、 カスタム・ 基盤モデル導入計画 を参照。
オンデマンド・デプロイ・モデルの時間単位の請求料金
お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 デプロイメントアクセスを許可した同僚だけが、 基盤モデル推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。
価格など、オンデマンドでの基盤モデルデプロイに関する詳細は、 でサポートされている基盤モデル watsonx.ai をご覧ください。
文書テキスト抽出の1ページあたりの料金
watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。 詳しくは、文書からテキストを抽出するを参照してください。
請求は、処理されたページごとに定額で行われます。 ページには、テキスト(1800文字まで)、画像、.tiffフレームを使用できます。 請求料金はプランの種類によって異なります。
プラン・タイプ | ページあたりの価格(米ドル |
---|---|
必須 | $0.038 |
標準 | $0.030 |
詳細情報
- 機械学習アセットの価格の詳細については、機械学習アセットの課金料金をご覧ください。
- コンピューティングリソースの割り当てと消費の追跡の詳細については 、「ランタイムの使用状況」 を参照してください。
- 各モデルの詳細については、対応するファンデーション・モデルを参照のこと。
- 各モデルの地域サポートの詳細については、 基盤モデルの地域別入手可能性 をご覧ください。
親トピック: watsonx.aiランタイムプラン