視覚的なツールを使用したAIサービスの展開
ビジュアル・ツールを使用して、RAG(Retrieval Augmented Generation)やエージェントAIなどの複雑なユースケース用のアプリケーションを構築すると、アプリケーションはAIサービスとして展開される。 AIサービスとは、生成型AIアプリケーションのロジックを捉えた、展開可能なコードの単位です。 AIサービスをデプロイした後は、スペースに用意されたテスト用インターフェイスからテストするか、エンドポイントにアクセスしてデプロイメント本番稼動させることができる。
AIサービスを展開するビジュアルツール
以下のいずれかのツールを使用してアプリケーションを構築すると、アプリケーションはAIサービスとしてデプロイされます
エージェントラボ: watsonx.ai でエージェントAIソリューションを構築し、展開するには、エージェントラボをご利用いただけます。 エージェントラボで構築したエージェントAIソリューションは、AIサービスとして展開されます。
Prompt Lab : Prompt Lab を使用して、Retrieval Augmented Generation (RAG) などの複雑なユースケースに対応する生成型AIソリューションを構築し、展開することができます。 Agent Labで構築する複雑なユースケースに対応するジェネレーティブAIソリューションは、AIサービスとして展開されます。
AutoAI (RAG用 ): を使用して、RAGベースの生成AI実験を構築し、AIサービスとして最も優れたパフォーマンスを発揮するパイプラインを展開することができます。 AutoAI
例えば、ベクトル化されたドキュメントインデックスからコンテンツを取得するロジックや、 基盤モデル推論で応答を生成するロジックを管理できる、 グラウンディングプロンプト用のAIサービスがあります。
デプロイメント方式
要件に応じて、次のいずれかのアプローチを使用して、サポートされているビジュアルツールからAIサービスとしてアプリケーションを展開できます
- 直接展開(ファストパス ):ソリューションが完成しており、これ以上の変更を加えたくない場合にこのオプションを使用します。 高速パスを使用して展開する場合は、 デプロイメントが自動的に作成されます。
- デプロイメント: デプロイメントなど、コードを追加または変更してソリューションをカスタマイズしたい場合は、このオプションを使用します。
ビジュアルツールに加えて資産プログラムで作成した場合は、プロジェクトから直接、アプリケーションを手動でAIサービスとしてデプロイすることができます。
次の表は、さまざまなツールやプロジェクトのデプロイメントオプションを対比したものです:
ツール | オンライン・デプロイメント | バッチ・デプロイメント | 直接デプロイ(ファストパス) | 配備ノートブック |
---|---|---|---|---|
Prompt Lab | 自動 | 手動 | 二段階プロセス | 自動生成 |
エージェント・ラボ | 自動 | 手動 | 二段階プロセス | 自動生成 |
AutoAI (RAG用) | 自動 | 手動 | 多段階プロセス | サポートされていません |
プロジェクト | 手動 | 手動 | 多段階プロセス | 手動で作成 |
AIサービスは、お客様のユースケースのロジックを把握し、展開可能なコードの単位である生成機能を含んでいます。 デプロイメントは、他のアプリケーションからアクセス可能なREST APIエンドポイントとして公開されます。 デプロイしたAIサービスを推論に使用するには、REST APIエンドポイントにリクエストを送信します。 展開されたAIサービスはリクエストを処理し、応答を返します。
ツールからの展開
高速パスを使用して、ビジュアルツールから直接展開するか、 デプロイメントに作業内容を保存して、AIサービスとしてソリューションを展開します。
ファストパスで展開
watsonx.ai でサポートされているビジュアルツールを使用してアプリケーションを構築した場合は、そのツールから直接ソリューションをデプロイすることができます。 ツールから直接デプロイすることで、AIサービスとしてのソリューションのデプロイを高速化でき、 デプロイメント自動的に作成されます。 デプロイメント作成後に変更できないため、展開する前にソリューションが完全に構築されていることを確認する必要があります。
バッチデプロイメント作成するには、プロジェクトからソリューションを手動で配置する 必要があります。 詳細については、 プロジェクトからのデプロイを参照してください。
Prompt Lab から RAG などの複雑なソリューションを展開したり、エージェントラボからエージェントを展開したりするには、以下の手順に従います
- ワークスペースから 「デプロイ」 をクリックします。
- デプロイメントの詳細を入力し、 デプロイメントスペースを選択または作成し、「作成」 をクリックします。
AutoAI, からRAGパターンを展開するには、以下の手順に従ってください
- AutoAI のエクスペリメントビルダーから、最もパフォーマンスの良いパイプラインを選択し、「名前を付けて保存」 をクリックします。
- Choose 取得と生成 as the objective, and select the AIサービス asset type.
- AIサービスをデプロイメントスペースにプロモートしてデプロイするためのオプションを有効にします。
- 既存デプロイメントスペースを選択するか、新しいスペースを作成し、「作成してデプロイ」 をクリックします。
この手順により、 デプロイメント自動的に作成されます。 デプロイメント作成され、ターゲットスペースで展開が開かれるので、 デプロイメントをテストしたり、推論用のエンドポイントにアクセスしたりすることができます。
自動生成されたノートブックからの展開
ビジュアルツールでアプリケーションを構築した後、 デプロイメントアプリケーションのロジックをカスタマイズしたい場合は、 デプロイメントに作業内容を保存することができます。 例えば、ベクトル化されたデータベースに新しい文書を追加したい場合、 AutoAI のRAGノートブックを編集して実行し、 AutoAI ツールで発見した最適化されたRAGパターンを更新したインデックスに適用することができます。
デプロイメントには、AIサービスのテスト、プロモーション、展開を行うためのコードが含まれています。 アプリケーションを展開するには、 デプロイメントに作業を保存する必要があります。 資産を展開するには、標準のノートパソコンは使用できません。
Prompt Lab または Agent Lab のデプロイメントノートブックにソリューションを保存します:
- 保存アイコン(
)をクリックし、ドロップダウンメニューから 「名前を付けて保存 」を選択します。
- 作業を保存 ダイアログボックスで、 デプロイメント を選択します。
- In the 詳細を定義する section, enter a name and an optional description for your deployment notebook.
- 保存 をクリックします。
When you save your work in a deployment notebook, watsonx.ai automatically generates a notebook which contains the code to test, promote, and deploy an AI service. AIサービスのオンラインデプロイメントを作成するには、 デプロイメント内のセルを実行します。
プロジェクトからのデプロイ
オンラインまたはデプロイメントを作成して、アプリケーションをAIサービスとして展開します。 デプロイメント、高可用性とリアルタイム更新を必要とするアプリケーションに適しており、 デプロイメント、複雑な更新や、計画的なダウンタイムが許容される場合に最適です。
前提条件
APIキーを生成して、タスクの認証情報を設定する必要があります。 詳細については、 タスク資格情報の管理を参照のこと。
オンラインデプロイメントの作成
AI 資産デプロイ可能な AI サービス資産としてプロジェクトに保存した場合は、次の手順に従って AI サービスをプロモートし、オンラインデプロイメントを作成します。
- プロジェクトまたはデプロイメントスペースの 資産 タブから、AI サービス用の 展開 を選択します。
- デプロイメントスペースを選択または作成します。
- デプロイメント オンラインを選択します。
- デプロイメントの名前を入力し、必要に応じて、サーバー名、説明、タグを入力します。
- 「作成」 をクリックします。
デプロイメントの作成
AI 資産をデプロイ可能な AI サービス資産としてプロジェクトに保存した場合は、次の手順に従って AI サービスをプロモートし、バッチデプロイメントを作成します。
- デプロイメントスペースから、 資産 タブに移動します。
- 資産内のAIサービス資産で、 メニューアイコンをクリックし、 デプロイを選択します。
- デプロイメント バッチを選択します。
- デプロイメントの名前を入力し、必要に応じて、サーバー名、説明、タグを入力します。
- ハードウェア仕様を選択してください
- エクストラ・スモール :CPU 1基、4GB RAM
- 小規模 :CPU2基、RAM8GB
- ミディアム :4CPU、16GB RAM
- 大規模 :8CPU、32GB RAM
- 特大 :16CPU、64GB RAM
- 「作成」 をクリックします。
次のステップ
親トピック: AIサービスの展開