0 / 0
資料の 英語版 に戻る
ジェネレーティブAI資産の展開
最終更新: 2025年1月23日
ジェネレーティブAI資産の展開

ジェネレーティブAIアセットをプロダクションで使用するためにデプロイし、デプロイされたアセットを監視する。

生成的AIアプリケーションのための配置可能な資産の種類

watsonx.aiを使用すると、ジェネレーティブAIアプリケーション用に以下のアセットをデプロイできます:

プロンプトテンプレートの展開

プロンプト・テンプレートをプロジェクト資産として保存した後、それをデプロイメント・スペースにプロモートできます。 デプロイメントスペースから、プロンプトテンプレートを本番環境にデプロイし、推論用のエンドポイントを取得できます。

watsonx.governance サービスを使用している場合は、ガバナンス要件を満たすために、プロンプト・テンプレートのデプロイメントの詳細をキャプチャーして追跡することもできます。

詳細は、プロンプトテンプレートの展開を参照のこと。

AIサービスの展開

AIサービスとは、Retrieval Augmented Generation(RAG)などの生成型AIのユースケースのロジックを捉えた、展開可能なコードの単位です。 AIサービスが正常にデプロイされたら、アプリケーションからの推論にエンドポイントを使用できます。

Prompt Lab や AutoAI などのビジュアルツールを使用して複雑な生成型AIソリューションを展開すると、AIサービスが自動的に作成されます。 For example, if you use the Prompt Lab to build and deploy your generative AI solution, the Prompt Lab automatically detects the complexity of the solution and presents the correct type of deployment asset. プロンプトテンプレートを使用して保存済みのプロンプトを作成し、 Prompt Lab にデプロイすることはできますが、RAGなどの複雑なユースケースに対応する生成型AIアプリケーションをデプロイすることはできません。

これらの複雑なユースケースに基づくジェネレーティブAIアプリケーションをコーディングする場合は、AIサービスを作成し、特定の要件を満たしていることを確認する必要があります。 watsonx.ai REST APIまたは Python クライアントライブラリを使用して、プログラムでAIサービスを展開することができます。 AIサービスを展開した後、推論用のエンドポイントを使用できます。

詳細については、AIサービスの導入を参照してください。

チューニングされたモデルの展開

foundation modelをチューニングし、チューニングしたモデルをプロジェクト・アセットとして保存したら、それをデプロイメント・スペースに昇格させることができます。 デプロイメントスペースから、チューニングされたモデルをテストし、推論用のエンドポイントを取得することができる。

詳細については、チューニングされたfoundation modelのデプロイを参照してください。

カスタム基盤モデルの展開

IBMがキュレーションした基盤モデルで作業するだけでなく、独自の基盤モデルをアップロードしてデプロイすることもできます。 モデルが展開され、 watsonx.ai に登録されたら、 Prompt Lab からカスタムモデルを推論するプロンプトを作成します。

カスタム・foundation modelを導入することで、ユースケースに適したAIソリューションを柔軟に導入することができます。

詳細については、カスタムfoundation modelのデプロイを参照してください。

基礎モデルのオンデマンド展開

専用ハードウェア上にオンデマンドでfoundation modelを展開し、必要に応じてさまざまなアプリケーションやサービスでfoundation modelを利用できるようにする。 このアプローチを使用することで、大規模な計算リソースを必要とせずに、これらの強力な基礎モデルの機能にアクセスすることができます。 オンデマンドでデプロイされたFoundationモデルは、専用のデプロイメントスペースにホストされ、推論に使用することができます。

詳しくは、基礎モデルをオンデマンドで展開するを参照してください。

詳細情報

親トピック watsonx.aiランタイムを使用したアセットのデプロイ