英語版 に戻る
watsonx.ai での基盤モデルの選択
資料の watsonx.ai での基盤モデルの選択
どのモデルがプロジェクトに適しているかを判別するには、ライセンス、事前トレーニング・データ、モデル・サイズ、およびモデルの微調整方法などのモデル属性を検討します。 ユース・ケースに最適なモデルの短いリストを作成したら、モデルを体系的にテストして、どのモデルが常に目的の結果を返すかを確認します。
モデル属性 | 考慮事項 |
---|---|
ライセンス | 一般に、各基盤モデルには、モデルの使用方法を制限する異なるライセンスが付属しています。 モデル・ライセンスを確認して、特定のモデルを計画したソリューションに使用できることを確認します。 |
サポートされる自然言語 | 多くの基盤モデルは、英語でのみうまく機能します。 しかし、一部のモデル作成者は、モデルの事前トレーニング・データ・セットに複数の言語を組み込んだり、異なる言語のタスクでモデルを微調整したり、複数の言語でモデルのパフォーマンスをテストしたりすることに注意を払っています。 翻訳タスクを実行するグローバル・オーディエンスまたはソリューション用のソリューションを作成する予定の場合は、複数言語サポートを考慮して作成されたモデルを探してください。 |
サポートされるプログラミング言語 | すべての基盤モデルがプログラミングのユース・ケースに適しているわけではありません。 コードの要約、生成、またはその他の処理を行うソリューションの作成を計画している場合は、モデルの事前トレーニング・データ・セットに含まれているプログラミング言語と微調整アクティビティーを検討して、そのモデルがユース・ケースに適合しているかどうかを判別してください。 |
コンテキストの長さ | コンテキスト・ウィンドウの長さ、コンテキスト・ウィンドウ、または最大シーケンス長と呼ばれることもあります。コンテキストの長さは、入力プロンプト内のトークンの数に、生成された出力内のトークンの数を加えた値の最大許容値です。 watsonx.aiでモデルを使用して出力を生成する場合、生成される出力のトークン数は、最大トークン数パラメーターと、モデル固有の環境駆動型の動的な上限によって制限されます。 パラメーター を参照してください。 |
微調整 | 事前にトレーニングされた後、多くの基盤モデルは、分類、情報抽出、要約、指示への応答、質問への回答、バック・アンド・フォース・ダイアログ・チャットへの参加など、特定のタスクに合わせて微調整されます。 計画された使用に類似したタスクで微調整されたモデルは、ユース・ケースに適合するように微調整されていないモデルよりも、ゼロ・ショット・プロンプトでパフォーマンスが向上します。 微調整されたモデルの結果を改善する 1 つの方法は、そのモデルを微調整するために使用されるデータ・セット内のプロンプトと同じ形式でプロンプトを構成することです。 |
親トピック: watsonx.aiで使用可能なサポート対象の基盤モデル