ジェネレーティブAI資産の使用量が、リソース単位(RU)、時間料金、または定額料金を使用してどのように測定されるかについては、こちらをご覧ください。
watsonx.aiRuntime でジェネレーティブ AI アセットを扱うには、watsonx.aiを使用している必要があります。 watsonx.aiの詳細については、 IBM watsonx.aiの概要を参照のこと。
リソースの測定方法の詳細を確認する:
- watsonx.aiが提供する基礎モデルの推論能力を測定するためのリソースユニット。
- watsonx.aiでインポートおよびデプロイしたカスタム基礎モデルの時間単価。
- 専用ハードウェアでオンデマンドに展開される、キュレーションされた基礎モデルの時間料金。
- ドキュメントのテキスト抽出のためのページ単位の定額料金。
基礎モデルの資源単位計量
対応基礎モデルのリストと価格については、対応基礎モデルを参照のこと。 対応エンコーダ機種と価格については、対応エンコーダ機種をご覧ください。
リソースユニット(RU)は、foundation modelの推論の入力と出力から1000トークンに相当する。 トークンとは、foundation modelのプロンプトの入力または出力、あるいはエンベッディング・モデルへの入力に使用されるテキストの基本単位(通常は4文字または0.75語)である。
IBM watsonx.aiが提供するfoundation modelには、入力と出力に対する推論価格が割り当てられている。 価格は1RUの基本価格(00.0001ドル)の倍数として算出される。 例えば、価格が00.0006ドルのモデルは、基本レートの6倍の倍率を持つ。
迅速に調整されたfoundation modelは、基礎foundation modelと同じ価格が割り当てられる。 チューニングされたファンデーション・モデルについては、Tuning Studioを参照。 Tuning Studioでモデルをチューニングするには、キャパシティ・ユニット・アワー(CUH)を消費します。 詳細については、機械学習資産の請求の詳細をご覧ください。
モデルごとのリソース単価の計算
foundation model推論の料金を計算するには、その月に消費されたトークンの合計数を1000で割り、1000未満を切り上げて合計RU数を算出する。 合計RU数にモデル価格を掛け合わせ、合計利用料金を算出する。 モデル価格はモデルによって異なり、特定のモデルの入力または出力トークンによっても異なる。
基本的な計算式は以下の通り:
Total tokens used/1000 = Resource Units (RU) consumed
RU consumed x model price = Total usage charge
RUの基本価格は00.0001ドル。 foundation modelの価格は、基本価格の倍数である。
倍率による請求クラス
watsonx.aiAPI でモデルの使用状況を監視している場合、モデルの価格は以下のように価格帯別に表示されます:
モデル価格 | USDでのRUあたりの価格 | 倍率 基準レート |
---|---|---|
クラス 1 | $0.0006 | 6 |
クラス 2 | $0.0018 | 18 |
クラス 3 | $0.0050 | 50 |
クラスC1 | $0.0001 | 1 |
クラス5 | $0.00025 | 2.5 |
クラス7 | $0.016 | 160 |
クラス8 | $0.00015 | 1.5 |
クラス9 | $0.00035 | 3.5 |
クラス10 | $0.0020 | 20 |
クラス11 | $0.000005 | 0.05 |
クラス12 | $0.0002 | 2 |
Mistral Largeなど一部のモデルには、倍率によらない特別価格が設定されている。 価格はサポートモデルで表示されている。
カスタム・ファンデーション・モデルの1時間あたりの請求料金
カスタム・ファンデーション・モデルの導入には、スタンダード・プランが必要です。
課金料金はモデルのハードウェア構成によって異なり、モデルのホスティングと推論に適用されます。 課金はモデルが正常に配置されたときに開始され、モデルが削除されるまで継続されます。
構成サイズ | 1時間あたりの請求レート(米ドル |
---|---|
小 | $5.22 |
中間 | $10.40 |
大 | $20.85 |
カスタムfoundation modelの構成の選択に関する詳細は、カスタムfoundation modelの展開計画を参照してください。
オンデマンド・デプロイ・モデルの時間単位の請求料金
お客様の組織専用にホストされたソリューションが必要な場合は、オンデマンドで基盤モデルを展開します。 配置へのアクセスを許可した同僚だけが、foundation modelを推論できます。 専用のデプロイメントを使用することで、より高速で応答性の高いインタラクションが可能になり、より大きなコンテキストウィンドウの長さでプロンプトを表示できます。 課金料金はモデルごとに設定され、モデルのホスティングと推論に適用される。 チャージはモデルが配備されたときに開始され、モデルが削除されるまで継続する。
価格など、オンデマンドでのfoundation modelの展開に関する詳細は、 watsonx.aiで利用可能な基盤モデルをご覧ください。
文書テキスト抽出の1ページあたりの料金
watsonx.aiREST APIのドキュメントテキスト抽出メソッドを使用して、高度に構造化され、図や表を使って情報を伝えるPDFファイルを、AIモデルに適したJSONファイル形式に変換します。 詳しくは、文書からテキストを抽出するを参照してください。
請求は、処理されたページごとに定額で行われます。 ページには、テキスト(1800文字まで)、画像、.tiffフレームを使用できます。 請求料金はプランの種類によって異なります。
プラン・タイプ | ページあたりの価格(米ドル |
---|---|
必須 | $0.038 |
標準 | $0.030 |
詳細情報
- 機械学習アセットの価格の詳細については、機械学習アセットの課金料金をご覧ください。
- コンピューティング・リソースの割り当てと消費のトラッキングに関する詳細は、ランタイムの使用状況を参照してください。
- 各モデルの詳細については、対応するファンデーション・モデルを参照のこと。
- 各モデルの地域サポートについては、ファンデーションモデルの地域サポートを参照。
親トピック: watsonx.aiランタイムプラン