0 / 0

ジェネレーティブAI資産の展開

最終更新: 2025年2月26日
ジェネレーティブAI資産の展開

ジェネレーティブAIアセットをプロダクションで使用するためにデプロイし、デプロイされたアセットを監視する。

生成的AIアプリケーションのための配置可能な資産の種類

watsonx.aiを使用すると、ジェネレーティブAIアプリケーション用に以下のアセットをデプロイできます:

プロンプトテンプレートの展開

プロンプト・テンプレートをプロジェクト資産として保存した後、それをデプロイメント・スペースにプロモートできます。 デプロイメントスペースから、プロンプトテンプレートを本番環境にデプロイし、推論用のエンドポイントを取得できます。

watsonx.governance サービスを使用している場合は、ガバナンス要件を満たすために、プロンプト・テンプレートのデプロイメントの詳細をキャプチャーして追跡することもできます。

詳細は、プロンプトテンプレートの展開を参照のこと。

AIサービスの展開

AIサービスとは、Retrieval Augmented Generation(RAG)などの生成型AIのユースケースのロジックを捉えた、展開可能なコードの単位です。 AIサービスが正常にデプロイされたら、アプリケーションからの推論にエンドポイントを使用できます。

Agent Lab、 Prompt Lab、 AutoAI などのビジュアルツールを使用して複雑な生成型AIソリューションを展開すると、AIサービスが自動的に作成されます。 例えば、Agent Labまたは Prompt Lab を使用してエージェンティックまたはジェネレーティブAIソリューションを構築および展開する場合、ツールがソリューションの複雑性を自動的に検出し、適切な資産を表示します。

プロンプトテンプレートを使用して保存済みのプロンプトを作成し、 Prompt Lab にデプロイすることはできますが、RAGなどの複雑なユースケースに対応する生成型AIアプリケーションをデプロイすることはできません。

これらの複雑なユースケースに基づくジェネレーティブAIアプリケーションをコーディングする場合は、AIサービスを作成し、特定の要件を満たしていることを確認する必要があります。 watsonx.ai REST APIまたは Python クライアントライブラリを使用して、プログラムでAIサービスを展開することができます。 AIサービスを展開した後、推論用のエンドポイントを使用できます。

詳細については、AIサービスの導入を参照してください。

チューニングされたモデルの展開

基盤モデルを調整し、調整したモデル資産保存した後、 デプロイメントに昇格させることができます。 デプロイメントスペースから、チューニングされたモデルをテストし、推論用のエンドポイントを取得することができる。

詳細については、「調整済みのモデルの展開 」を参照してください。

カスタム基盤モデルの展開

IBMがキュレーションした基盤モデルで作業するだけでなく、独自の基盤モデルをアップロードしてデプロイすることもできます。 モデルが展開され、 watsonx.ai に登録されたら、 Prompt Lab からカスタムモデルを推論するプロンプトを作成します。

カスタム基盤モデルを導入することで、ユースケースに最適なAIソリューションを柔軟に導入することができます。

詳細については、 カスタム基盤モデルを展開する をご覧ください。

基礎モデルのオンデマンド展開

基盤モデル専用ハードウェアにオンデマンドで展開し、必要に応じてさまざまなアプリケーションやサービスで基盤モデルを使用できるようにします。 このアプローチを使用することで、大規模な計算リソースを必要とせずに、これらの強力な基礎モデルの機能にアクセスすることができます。 オンデマンドでデプロイされたFoundationモデルは、専用のデプロイメントスペースにホストされ、推論に使用することができます。

詳しくは、基礎モデルをオンデマンドで展開するを参照してください。

詳細情報

親トピック watsonx.aiランタイムを使用したアセットのデプロイ