カスタム・ 基盤モデル導入計画
watsonx.ai を使用して推論用のカスタム基盤モデル展開するための考慮事項と要件を確認する。
カスタム・ 基盤モデル配備を準備する際には、以下の計画上の注意点を確認してください:
- カスタム基盤モデルの要件と使用上の注意点を確認する
- Supported architectures for custom foundation models を確認して、あなたのモデルが互換性があることを確認してください。
- カスタム基盤モデル展開するための前提条件として必要な詳細を収集する。
- カスタム・ 基盤モデルハードウェア仕様を選択する.
- 配備の制限を確認する
- カスタム基盤モデルをデプロイできるように、タスク認証情報を有効にします。
カスタム・ファンデーション・モデルの要件と使用上の注意Copy link to section
配備可能なカスタムモデルは、これらの要件を満たさなければならない:
独自のカスタムモデルをアップロードして使用できるのは、watsonx.ai のスタンダードプランのみです。
モデルは、Text Generation Inference(TGI)標準と互換性があり、サポートされているモデル・アーキテクチャ・タイプで構築されていなければならない。
モデルのファイルリストには、
ファイルが含まれていなければなりません。config.json
モデルは、サポートされているトランスフォーマーライブラリを使った
形式で、safetensors
ファイルを含んでいなければなりません。tokenizer.json
重要:- カスタム・ 基盤モデル、サポートされている
ライブラリと共に保存されていることを確認する必要があります。 カスタム 基盤モデル model.safetensors、メタデータヘッダにサポートされていないデータ形式が使用されている場合、 デプロイメント失敗する可能性があります。 詳しくは、 watsonx.ai ランタイムのトラブルシューティングをご覧ください。transformers
- カスタム・ 基盤モデルデプロイするプロジェクトまたはスペースに、関連する watsonx.ai Runtime インスタンスがあることを確認してください。 プロジェクトまたはスペースの「管理」タブを開いて確認してください。
- カスタム・ 基盤モデル、サポートされている
対応モデル・アーキテクチャCopy link to section
次の表は、watsonx.ai で推論を行うためのカスタムモデルとして配置できるモデルアーキテクチャの一覧です。 モデルのアーキテクチャは、サポートされている量子化方法、並列テンソル、配置構成サイズ、ソフトウェア仕様に関する情報とともにリストアップされている。
Two software specifications are available for your deployments:
, watsonx-cfm-caikit-1.0
. The watsonx-cfm-caikit-1.1
specification is better in terms of performance, but it's not available with every model architecture.watsonx-cfm-caikit-1.1
モデル・アーキテクチャ・タイプ | 基盤モデルの例 | 量子化法 | 並列テンソルmultiGpu | 導入の構成 | ソフトウェア仕様 |
---|---|---|---|---|---|
|
,
|
適用されない | はい | スモール、ミディアム、ラージ | ,
|
|
,
|
適用されない | いいえ | 小 |
|
|
|
適用されない | いいえ | 小 |
|
|
適用されない | はい | スモール、ミディアム、ラージ | ,
|
|
|
|
適用されない | はい | 小・中・大 |
|
|
|
適用されない | はい | 小・中・大 |
|
|
,
|
|
はい | スモール、ミディアム、ラージ | ,
|
|
, ,
|
適用されない | はい | スモール、ミディアム、ラージ | ,
|
|
|
適用されない | いいえ | 小 | ,
|
|
, , ,
|
適用されない | いいえ | 小 |
|
|
, , , , ,
|
|
はい | スモール、ミディアム、ラージ | ,
|
|
,
|
適用されない | いいえ | 小 | ,
|
|
,
|
|
いいえ | 小 |
|
|
, ,
|
適用されない | いいえ | 小 | ,
|
|
,
|
適用されない | いいえ | 小 |
|
|
|
適用されない | はい | 小・中・大 |
|
|
,
|
適用されない | はい | 小・中・大 |
|
|
,
|
適用されない | はい | 小・中・大 |
|
|
,
|
適用されない | はい | 小・中・大 |
|
|
|
適用されない | はい | 小・中・大 |
|
|
|
適用されない | はい | 小・中・大 |
|
|
|
|
はい | 小・中・大 |
|
|
,
|
適用されない | はい | スモール、ミディアム、ラージ |
|
- IBM は、表1に示すモデル・アーキテクチャのみを認証する。 vLLM, でサポートされている別のアーキテクチャのモデルを使用することはできますが、 IBM は、サポートされていないアーキテクチャや互換性のない機能を持つ基盤モデルデプロイしたことによるデプロイメント失敗をサポートしません。
モデルのデプロイが失敗する可能性があります。 この問題に対処するには、トラブルシューティングに記載されている手順を参照してください。llama 3.1
- It is not possible to deploy
,codegen
, andmt5
type models with thet5
software specification.watsonx-cfm-caikit-1.1
- モデルが並列テンソルをサポートしていない場合、使用できる設定は
だけです。Small
がサポートする設定よりも多くのパラメータを使ってモデルをトレーニングした場合は、失敗します。 これは、カスタムモデルのいくつかをデプロイできないことを意味する。 制限の詳細については、リソース利用ガイドラインをご覧ください。Small
カスタム基盤モデル前提条件の詳細を収集するCopy link to section
基盤モデル内にファイル
が存在するか確認する。 デプロイメント、クラウドストレージにアップロードされた後、 基盤モデルコンテンツフォルダ内にファイルconfig.json
が存在するかどうかを確認します。config.json
ファイルを開き、 基盤モデル サポートされているアーキテクチャを使用していることを確認する。config.json
、モデルの内容がtokenizer.json
形式であることを確認するために、 基盤モデルモデルのファイル一覧を表示します。.safetensors
重要:カスタム・ 基盤モデル、サポートされている
ライブラリと共に保存されていることを確認する必要があります。 カスタム 基盤モデル model.safetensors、メタデータヘッダにサポートされていないデータ形式が使用されている場合、 デプロイメント失敗する可能性があります。 詳しくは、 watsonx.ai ランタイムのトラブルシューティングをご覧ください。transformers
例を見てみよう:
Hugging Face に保存されている falcon-40b モデルについては、 ファイルとバージョン をクリックしてファイル構造を表示し、
を確認しますconfig.json
サンプルモデルは、サポートされている
アーキテクチャのバージョンを使用しています。falcon
このサンプルモデルは
ファイルを含み、tokenizer.json
フォーマットになっています:.safetensors
モデルがこれらの要件を満たしていない場合、モデル資産を作成してモデルをデプロイすることはできません。
資源利用ガイドラインCopy link to section
カスタム・ 基盤モデルサポートするために、3つの構成が用意されている: Small
および Medium
。 カスタム・ 基盤モデル モデルに最適な構成を決定するには、以下のガイドラインを参照してください:Large
- 26B パラメータの下で、
コンフィギュレーションを任意のダブルバイト精度モデルに割り当て、テストと検証を行う。Small
- 27B と 53B のパラメータの間の任意のダブルバイト精度モデルに
コンフィギュレーションを割り当て、テストと検証を行う。Medium
- 54B から 106B パラメータ間の任意のダブルバイト精度モデルに
コンフィギュレーションを割り当て、テストと検証を行う。Large
選択したコンフィギュレーションがテストと検証の段階で失敗した場合、次に利用可能な上位コンフィギュレーションを検討する。 例えば、
の設定が失敗したら、Small
の設定を試してください。 現在のところ、Medium
のコンフィギュレーションが最も高いコンフィギュレーションです。Large
構成 | 適切なモデルの例 |
---|---|
小 |
|
中間 |
|
大 |
|
カスタム・ファンデーション・モデルの制限と制約Copy link to section
watsonx.aiでカスタム基礎モデルをデプロイして使用する方法について、これらの制限に注意してください。
カスタム・ファウンデーション・モデルの展開における制限事項Copy link to section
カスタム・ 基盤モデル デプロイメント需要が高く、それに対応するためのリソースが限られているため、 watsonx.ai、1つの IBM Cloud アカウントにつき4つの小型モデル、2つの中型モデル、または1つの大型モデルのいずれかをデプロイメント上限としています。 これらの制限を超えてカスタム・ 基盤モデルインポートしようとすると、その旨が通知され、アンケートを通じてご意見をお聞かせいただくことになります。 これは、お客様のニーズを理解し、将来の容量アップグレードを計画するのに役立ちます。
カスタム・ 基盤モデル デプロイメント使用する際の制限事項Copy link to section
watsonx.ai:でデプロイされた後、カスタム基盤モデルを使用するための以下の制限に注意してください
- カスタム・ 基盤モデルチューニングすることはできない。
- watsonx.governance を使用して、カスタム基盤モデルモデルのプロンプトテンプレートを評価または追跡することはできません。
- 基盤モデルプロンプトを表示することはできますが、カスタムモデルのプロンプトテンプレートを保存することはできません。
この体験の改善にご協力くださいCopy link to section
ご意見をお聞きになりたい方は、このリンクをクリックしてください。 皆様からのフィードバックは、今後のキャパシティアップグレードの計画や、 基盤モデル デプロイメント全体の向上に欠かせません。 ご協力ありがとう!
次のステップCopy link to section
親トピック カスタム基盤モデル展開