RAGアクセラレータのQ&Aを試して、提供された文書の情報に基づいた事実上正確な出力を生成する検索拡張生成 (RAG)を設定してください。
リソース ハブにログインし、 RAG Accelerator サンプル プロジェクトを使用して Q&A を作成します。
RAGアクセラレータとのQ&Aでは、高度なRAGパターンと実装を提供しており、次のプロセスを含みます
- 文書処理 :ベクトルインデックスを生成するための文書の変換、処理、インデックス作成。
- 回答生成 :ベクトル検索結果に基づく検索拡張生成による質問応答。
- 入出力のログ :質問、取得されたチャンクおよびメタデータ、回答のログを2番目のログインデックスに記録する。
- ユーザーフィードバックの収集 :ユーザーフィードバックは、一致する入力/出力ログエントリに追加されます。
- コンテンツ分析: 否定的なユーザーフィードバックを受けた回答を改善するために強化すべき特定のコンテンツに関するレポート。
- 人的介入 :専門家プロフィールを含むベクトルインデックスを使用して、不十分な回答に対応する最適な専門家を特定する。
次の図は、RAG Accelerator による Q&A のプロセスが循環的であることを示しており、ユーザーからのフィードバックに基づいてドキュメントの内容が更新される仕組みを表しています。
文書処理
文書処理およびインデックス作成用のノートブックは、以下のベクターデータベースのいずれかにおいて、文書変換、分割、ベクターインデックスのインデックス作成を自動化します
- watsonx.data Milvus
- watsonx Elastic Search Enterpriseまたは Platinumでのディスカバリー。 IBM Cloud Databases for Elasticsearch
ベクトル化する文書サンプル集は、この文書 watsonx as a Service のバージョンをZIPファイルにまとめたものです。 watsonx 以外のツールで作成した既存のベクトルインデックスを実行するようにノートブックをカスタマイズできます。例えば、Elasticコネクタおよびパイプライン、Sparkパイプライン、または独自のプロセスなどです。
回答の生成
The notebook for the Q&A Python function defines the Python function code and automates its deployment with a well-defined URL suffix in a deployment space. RAG Python 機能コードのQ&Aは、パラメータセットによって構成されます。 この関数は質問を入力として受け取り、質問に答えるのに最も関連性の高いチャンクを取得するためにベクトルインデックスを照会し、ソース文書へのリンクを含むチャンクのメタデータを取得します。 この関数は、最も関連性の高いチャンクを構成済みのプロンプトテンプレートに追加し、生成された回答、計算された忠実度スコア、およびメタデータとともに取得されたチャンクを返します。
入出力のログ記録
RAG Python 機能を使用した Q&A の呼び出しごとに、プロンプトの入力および出力テキストのログ取得を有効にすることができます。 ログ記録の前に、すべての個人情報は文字列から削除されます。 ベクトルデータベース内のドキュメントのログインデックスは、ベクトルインデックスとは別個です。
入出力のログ記録が有効になっている場合、ユーザーが質問を入力する際に、入力候補の質問補完機能を有効にすることができます。 ユーザーが最近回答した質問に基づいて完了を受け入れた場合、その回答はログインデックスから取得され、時間とGPUによる推論および取得コストが削減されます。
ユーザーフィードバックの収集
ユーザーからのフィードバックは、利害関係者がそのソリューションがユーザーにどの程度役立っているか、ユーザーがどのトピックに関心を持っているか、また、ソリューションがコンテンツに基づく質問にどの程度適切に回答できているかを理解するのに役立ちます。 回答に対するユーザーからのフィードバックを収集するために、RAG Python 機能を使用してQ&Aを再度呼び出すようアプリケーションを設定することができます。 満足度スコアと任意のコメントというユーザーからのフィードバックは、その後の分析用にQ&Aログレコードに追加されます。
コンテンツ分析
ユーザーフィードバック分析ノートブックを設定し、直接実行するか、 ジョブ実行することができます。 ノートブックは、指定した時間間隔または開始日と終了日のログデータを照会します。 ノートブックはログデータをデータフレームに読み込み、BERTopic または Watson 自然言語処理による教師なしトピック検出を使用して、回答を生成するために最も頻繁に取得されたドキュメントトピックを決定します。 このノートブックは、トピックごとにユーザー満足度を分析し、可視化します。また、評価の低い回答に対する質問、回答、ユーザーからのフィードバックコメントも含まれています。 これらの洞察に基づいて、利害関係者や知識コンテンツの所有者は、より良い回答につながるコンテンツの改善を推進することができます。
人間の介在
ユーザーが回答に満足していない場合、より適切な回答を提供できる専門家の連絡先を取得するようにアプリケーションを設定することができます。 エキスパートプロファイリングノートブックを設定して、エキスパートプロファイル文書を処理し、その情報に基づいてインデックスを構築することができます。 例えば、アプリケーションは質問をエキスパートに転送し、エキスパートの回答をユーザーに送信し、コンテンツの改善の可能性についてナレッジベースの所有者に警告することができます。
詳細情報
親トピック: AIソリューションアクセラレータ