IBM が提供する業界向けアクセラレータは、一連のエンドツーエンドソリューションであり、一般的なビジネス課題に対処するために、例として実行したり、カスタマイズしたりすることができます。
業界アクセラレーターの概要
業界特化型アクセラレータは、生成型AIソリューションで特定のビジネス上の問題を解決するお手伝いをします。 リソースハブでアクセラレータを閲覧し、必要なものを自分で作成してください。
アクセラレータは、ジェネAIソリューションを構築するために必要なすべてが含まれたサンプルプロジェクトで構成されています。 サンプルプロジェクトには、データ資産、Jupyterノートブック、スクリプト、ジョブ、パラメータセットを含めることができます。
プロセスの概要
各アクセラレーターで詳細な手順が提供されます。 以下のステップは、サンプル・プロジェクトのプロセスの概要を示しています。
アクセラレータを始めるには:
- リソースハブのサンプルプロジェクトにアクセスします。 リソースハブ内のサンプルをフィルタリングして、すべてのプロジェクトまたは業界別アクセラレータを表示することができます。
- 「プロジェクトを作成」 をクリックし、プロジェクト作成の手順に従ってください。
- 指示に従ってノートブックを実行し、その他のタスクを完了します。
RAGアクセラレーターとのQ&A
RAGアクセラレータのQ&A を試して、提供された文書の情報に基づいた事実上正確な出力を生成する検索拡張生成検索拡張生成 (RAG)を設定してください。 リソースハブ内のアクセラレータにアクセスするには watsonxにログインする必要があります。
RAGアクセラレータとのQ&Aでは、高度なRAGパターンと実装を提供しており、次のプロセスを含みます
- 文書処理 :ベクトルインデックスを生成するための文書の変換、処理、インデックス作成。
- 回答生成 :ベクトル検索結果に基づく検索拡張生成による質問応答。
- 入出力のログ :質問、取得されたチャンクおよびメタデータ、回答のログを2番目のログインデックスに記録する。
- ユーザーフィードバックの収集 :ユーザーフィードバックは、一致する入力/出力ログエントリに追加されます。
- コンテンツ分析: 否定的なユーザーフィードバックを受けた回答を改善するために強化すべき特定のコンテンツに関するレポート。
- 人的介入 :専門家プロフィールを含むベクトルインデックスを使用して、不十分な回答に対応する最適な専門家を特定する。
次の図は、RAGアクセラレータとのQ&Aプロセスが循環的であることを示しており、ユーザーからのフィードバックに基づいてドキュメントの内容が更新される仕組みを表しています。
文書処理
文書処理およびインデックス作成用のノートブックは、以下のベクターデータベースのいずれかにおいて、文書変換、分割、ベクターインデックスのインデックス作成を自動化します
- watsonx.data Milvus
- watsonx with Elastic Search Enterprise または IBM Cloud Databases for Elasticsearch Platinum。
ベクトル化する文書サンプル集は、このwatsonx as a Service のバージョンをZIPファイルにまとめたものです。 watsonx 以外のツールで作成した既存のベクトルインデックスを実行するようにノートブックをカスタマイズできます。例えば、Elasticコネクタとパイプライン、Sparkパイプライン、または独自のプロセスなどです。
回答の生成
Q&A Pythonのノートブックでは Pythonを定義し、 デプロイメント・スペース内の明確に定義された URLを使用してデプロイメントを自動化します。 Python 関数コードの Q&A はパラメータセットによって構成されます。 この関数は質問を入力として受け取り、質問に答えるのに最も関連性の高いチャンクを取得するためにベクトルインデックスを照会し、ソース文書へのリンクを含むチャンクのメタデータを取得します。 この関数は、最も関連性の高いチャンクを構成済みのプロンプトテンプレートに追加し、生成された回答、計算された忠実度スコア、およびメタデータとともに取得されたチャンクを返します。
入出力のログ記録
Python 関数との Q&A の呼び出しごとに、プロンプトの入力と出力テキストのログ取得を有効にすることができます。 ログ記録の前に、すべての個人情報は文字列から削除されます。 ベクトルデータベース内のドキュメントのログインデックスは、ベクトルインデックスとは別個です。
入出力のログ記録が有効になっている場合、ユーザーが質問を入力する際に、入力候補の質問補完機能を有効にすることができます。 ユーザーが最近回答した質問に基づいて完了を受け入れた場合、その回答はログインデックスから取得され、時間とGPUによる推論および取得コストが削減されます。
ユーザーフィードバックの収集
ユーザーからのフィードバックは、利害関係者がそのソリューションがユーザーにどの程度役立っているか、ユーザーがどのトピックに関心を持っているか、また、ソリューションがコンテンツに基づく質問にどの程度適切に回答しているかを理解するのに役立ちます。 回答に対するユーザーからのフィードバックを収集するために、Q Pythonで再度呼び出すようアプリケーションを設定することができます。 満足度スコアと任意のコメントというユーザーからのフィードバックは、その後の分析用にQ&Aログレコードに追加されます。
コンテンツ分析
ユーザーフィードバック分析ノートブックを設定し、直接実行するか、ジョブとして実行することができます。 ノートブックは、指定した時間間隔または開始日と終了日のログデータを照会します。 ノートブックはログデータをデータフレームに読み込み、BERTopicまたは Watson の教師なしトピック検出を使用して、回答を生成するために最も頻繁に取得されたドキュメントトピックを決定します。 このノートブックは、トピックごとにユーザー満足度を分析し、可視化します。また、評価の低い回答に対する質問、回答、ユーザーからのフィードバックコメントも含まれています。 これらの洞察に基づいて、利害関係者や知識コンテンツの所有者は、より良い回答につながるコンテンツの改善を推進することができます。
人間の介在
ユーザーが回答に満足していない場合、より適切な回答を提供できる専門家の連絡先を取得するようにアプリケーションを設定することができます。 エキスパートプロファイリングノートブックを設定して、エキスパートプロファイル文書を処理し、その情報に基づいてインデックスを構築することができます。 例えば、アプリケーションは質問をエキスパートに転送し、エキスパートの回答をユーザーに送信し、コンテンツの改善の可能性についてナレッジベースの所有者に警告することができます。
親トピック: 入門