検索支援生成(RAG)実験パイプラインを保存すると、ノートブックが自動的に生成され、プロジェクトに保存されます。 Milvus の実験の場合、RAGパターンをAIサービスとして保存し、展開することもできます。 RAGパターンを保存し、アプリケーションでパターンを使用するためのオプションについて学びましょう。
RAGパターンを自動生成されたノートブックとして保存
実験を実行した後、最適化された指標に対するパフォーマンスに従ってリーダーボードにランク付けされた生成パターンをレビューすることができます。 パターンに満足したら、それを保存し、プロジェクト資産として保存された1つまたは2つのノートブックを生成することができます。 If you create a Milvus experiment, you also have the option of deploying immediately as an AI asset.
保存されたRAGパターンに対して生成されるノートブックは、以下のように実験に使用されるベクターストアに依存する:
- インデックスノートブックは、文書コレクションのベクトルインデックスを入力、更新、維持します。 すべてのAutoAIRAGパターンは、索引ノートブックを生成することができます。
- 推論ノートブックは、拡張された検索機能を持つ大規模な言語モデルに対して推論を行うためのエンドポイントを提供する。 Milvus データベースをベクトルストアとして使用する実験のみが、推論ノートブックを生成します。
For a Milvus experiment, an AIサービス packages a pipeline for immediate deployment to a deployment space, where you can inference against the endpoint.
索引ノートと推論ノートの作成
パイプラインを確認したら、以下の手順に従ってパイプラインを保存し、関連するノートブックを生成します。
- 実験リーダーボードから、パイプライン名をクリックして詳細を見る。
- 保存 をクリックします。 パネルには、自動生成されたノートブックが表示されます。 例えば、以下の画像は、インメモリChromaデータベースをベクターストアとして使用して作成したパターンの保存パネルです。
- 「作成」 をクリックします。
- 関連プロジェクトのノートブックを開いて、コードをレビューしたり実行したりする。 例えば、インデックス・ノートブックは以下のようになる:
認証情報を追加することで、ノートブックをレビューしたり、実行したりすることができる。
インデックス・ノートを見直す
インデックスノートブックには、文書コレクションのベクトルデータベースインデックスを構築するためのPythonコードが含まれています。
このノートには注釈がついているので、手順やコードを確認することができる:
- ベクトル化するデータの取得
- データのチャンキング
- エンベッディングの作成
- ベンチマークデータの読み方
- 検索品質を評価するためのベンチマークデータの使用
推論ノートの見直し
推論ノートブックにはPythonのコードが含まれている:
- 各ユーザークエリに対して、インデックスされた文書から関連する文章を取得する
- 生成されたレスポンスで使用するために、検索された文章を大規模な言語モデルに入力することによって、各ユーザークエリに対するレスポンスを生成する
このノートには注釈がついているので、手順やコードを確認することができる:
- 実験で特定されたRAGパターンを用いた推論Python関数の構築
- 推論エンドポイントとして関数を配置する
- 生成された応答の入力として、関連する文章を検索するテスト
推論ノートブックを実行し、質問に対する答えを検索して生成するためにRAGパターンを使用する。
RAGパターンをデプロイ可能なAIサービスとして保存する
Milvus ベクターストアを使用して実験を行った場合、RAGパターンをデプロイ可能なAIサービスとして保存するオプションもあります。 AIサービス:
- 展開可能な Python 機能は、RAGパターン用のロジックを捕捉します。
- 資産を作成します。
- オプションとして 資産 デプロイメントスペースにプロモートし、 デプロイメントを作成します。これにより、エンドポイントにアクセスしてパターンを推論できるようになります。
AIサービスを作成して展開するには:
- RAGパターンを 「名前を付けて保存」します。
- 目的として 「検索と生成 」を選択します。
- Choose AIサービス as the asset type.
- AIサービスデプロイメントスペースに展開し、推進する を選択します。
- 「作成して展開 」をクリックします。
- 既存のデプロイメント・スペースを選択するか、新規のデプロイメント・スペースを作成します。
デプロイメントが完了したら、 デプロイメントをクリックしてテスト用にAIサービスを開きます。 デプロイメント、次のことができます
- アプリケーションでRAGパターンを使用するには 、APIリファレンスタブからエンドポイントとコードスニペットを取得します。
- テストタブに切り替えて、RAGパターンで使用するJSON形式の新しい質問を入力またはアップロードします。 評価問題で使用したのと同じJSON形式を使用しますが、回答は入力しないでください。
詳細情報
Prompt Labで、この実験で索引付けされた文書を使用して、 foundation modelのプロンプトを作成する。 文書とのチャットに AutoAI Ragインデックスを使用する 」を参照してください。
親トピック RAG実験の作成