ジェネレーティブAI資産の展開
ジェネレーティブAIアセットをプロダクションで使用するためにデプロイし、デプロイされたアセットを監視する。
生成的AIアプリケーションのための配置可能な資産の種類
watsonx.aiを使用すると、ジェネレーティブAIアプリケーション用に以下のアセットをデプロイできます:
プロンプトテンプレートの展開
プロンプト・テンプレートをプロジェクト資産として保存した後、それをデプロイメント・スペースにプロモートできます。 デプロイメントスペースから、プロンプトテンプレートを本番環境にデプロイし、推論用のエンドポイントを取得できます。
watsonx.governance サービスを使用している場合は、ガバナンス要件を満たすために、プロンプト・テンプレートのデプロイメントの詳細をキャプチャーして追跡することもできます。
詳細は、プロンプトテンプレートの展開を参照のこと。
AIサービスの展開
AIサービスとは、Retrieval Augmented Generation(RAG)などの生成型AIのユースケースのロジックを捉えた、展開可能なコードの単位です。 AIサービスが正常にデプロイされたら、アプリケーションからの推論にエンドポイントを使用できます。
Agent Lab、 Prompt Lab、 AutoAI などのビジュアルツールを使用して複雑な生成型AIソリューションを展開すると、AIサービスが自動的に作成されます。 例えば、Agent Labまたは Prompt Lab を使用してエージェンティックまたはジェネレーティブAIソリューションを構築および展開する場合、ツールがソリューションの複雑性を自動的に検出し、適切な資産を表示します。
プロンプトテンプレートを使用して保存済みのプロンプトを作成し、 Prompt Lab にデプロイすることはできますが、RAGなどの複雑なユースケースに対応する生成型AIアプリケーションをデプロイすることはできません。
これらの複雑なユースケースに基づくジェネレーティブAIアプリケーションをコーディングする場合は、AIサービスを作成し、特定の要件を満たしていることを確認する必要があります。 watsonx.ai REST APIまたは Python クライアントライブラリを使用して、プログラムでAIサービスを展開することができます。 AIサービスを展開した後、推論用のエンドポイントを使用できます。
詳細については、AIサービスの導入を参照してください。
チューニングされたモデルの展開
基盤モデルを調整し、調整したモデル資産保存した後、 デプロイメントに昇格させることができます。 デプロイメントスペースから、チューニングされたモデルをテストし、推論用のエンドポイントを取得することができる。
詳細については、「調整済みのモデルの展開 」を参照してください。
カスタム基盤モデルの展開
IBMがキュレーションした基盤モデルで作業するだけでなく、独自の基盤モデルをアップロードしてデプロイすることもできます。 モデルが展開され、 watsonx.ai に登録されたら、 Prompt Lab からカスタムモデルを推論するプロンプトを作成します。
カスタム基盤モデルを導入することで、ユースケースに最適なAIソリューションを柔軟に導入することができます。
詳細については、 カスタム基盤モデルを展開する をご覧ください。
基礎モデルのオンデマンド展開
基盤モデル専用ハードウェアにオンデマンドで展開し、必要に応じてさまざまなアプリケーションやサービスで基盤モデルを使用できるようにします。 このアプローチを使用することで、大規模な計算リソースを必要とせずに、これらの強力な基礎モデルの機能にアクセスすることができます。 オンデマンドでデプロイされたFoundationモデルは、専用のデプロイメントスペースにホストされ、推論に使用することができます。
詳しくは、基礎モデルをオンデマンドで展開するを参照してください。