AutoAI,で検索支援型生成ソリューションを構築する場合、実験設定をカスタマイズして結果を調整することができます。
デフォルト設定に基づいてRAG実験を実行した場合、AutoAIプロセスは選択する:
- RAGパイプラインをランク付けする最適化指標
- 入力データを符号化するための埋め込みモデル
- 利用可能なリストに基づいて、試すべきファンデーションモデル
RAG実験をよりコントロールするために、実験設定をカスタマイズすることができます。 必要な実験定義情報を入力した後、Experiment settings をクリックし、実験を実行する前にオプションをカスタマイズする。 見直しや編集が可能な設定は、3つのカテゴリーに分類されます:
- 検索と生成:RAGパターンの最適化に使用するメトリック、データの検索方法、およびAutoAIが実験に使用できるモデルを選択します。
- インデクシング:データをどのように分解するか、データの関連性を測定するために使用するメトリック、およびAutoAIが実験に使用できる埋め込みモデルを選択します。
- 追加情報: watsonx.ai Runtime インスタンスと実験に使用する環境を確認する。
検索と生成の設定
RAG パイプラインの生成に使用する設定を表示または編集します。
最適化指標
RAGパイプラインの最適化とランキングに使用する指標を選択する。
- 回答の忠実度は、生成された回答が検索されたテキストに対して、意味的・構文的にどの程度一致しているかなど、正確さを測定する。
- 回答の正しさは、検索されたコンテキストの関連性と生成された回答の品質の両方を含む、生成された回答の正しさを測定します。
- 文脈の正しさは、検索されたコンテンツと元の質問との関連性を測定する。
取得方法
関連データを検索する方法を選択します。 検索方法は、文書をフィルタリングしてランク付けする方法が異なる。
- ウィンドウ検索法は、インデックス化された文書をウィンドウ(塊)に分割し、元の文書にあった内容に基づいて、検索された塊の前後にコンテンツを追加する。
- 単純な検索方法は、インデックス文書から関連するすべての文章を検索し、質問に対する関連性に従ってそれらをランク付けする。 最上位の文書が答えとして提示される。
ウィンドウ検索は、比較的小さな文書コレクションに対するクエリでは、より効率的な選択となる。 単純な検索は、より大きなコレクションに対するクエリに対して、より正確な結果を生成することができる。
ファンデーション・モデル
AutoAIがRAGパイプラインを生成するために考慮できる基礎モデルのリストを編集します。 各モデルについて、「モデルの詳細」をクリックすると、使用目的の説明を含むモデルの詳細を表示またはエクスポートすることができます。
利用可能なファンデーションモデルのリストと説明については、タスク別のファンデーションモデルを参照のこと。
完成させる最大 RAG パターン
完成させるRAGパターンの数は、最大20まで指定できる。 数が多ければ多いほど、比較できるパターンが増えるが、より多くの計算リソースを消費する。
索引付け設定
ドキュメントコレクションからテキストベクターデータベースを作成するための設定を表示または編集します。
チャンク化
チャンキング設定は、 foundation model による処理のためにインデックス化されたドキュメントがどのように細分化されるかを決定します。 データをチャンク化することで、 foundation model は複数のデータを並行して処理することができ、効率が向上します。 チャンクが重複していることで、チャンク間のコンテクストが失われることがない。
データのチャンキング方法は、ユースケースによって異なります。 より小さなチャンクは、テキストとのより詳細なやりとりを可能にし、例えばキーワードの特定に役立ちます。一方、より大きなチャンクは、特定の単語やフレーズに焦点を当てるのではなく、より多くの文脈を提供することができます。 チャンキングのユースケースでは、以下を指定します
- 各データチャンクに含める文字の数。
- チャンキングデータでオーバーラップする文字の数。 この数値はチャンキングサイズよりも小さくなければなりません。
埋め込みモデル
埋め込みモデルは、テキストデータをベクトルとして符号化し、自然言語文字列の意味的な意味を捕捉するための検索支援生成ソリューションで使用される。 ベクトル化された入力データは、出力テキストを生成するために、索引付けされた文書コレクションから類似のデータを検索するために使用することができる。 実験実行時にAutoAIが考慮できる埋め込みモデルのリストを編集する。
AutoAIRAG 実験で使用可能な埋め込みモデルのリストについては、 watsonx.aiで使用可能な埋め込みモデルを参照してください。
詳細情報
この実験に使用した watsonx.ai Runtime インスタンスと環境定義を確認する。
詳細情報
親トピック RAG実験の作成