資料の 英語版 に戻る

相互ランク評価指標

最終更新: 2025年3月05日
相互ランク評価指標

相互ランクメトリックは、最初の関連コンテキストの相互ランクを測定します。

メトリックの詳細

相互ランクは、生成型AIの品質評価のための検索品質指標であり、検索システムが関連文脈をランク付けする方法の品質を測定する。 検索品質の評価指標は、LLMを裁判官に見立てたモデルで算出されます。

範囲

相互ランクメトリックは、生成型AI 資産のみを評価します。

  • AI 資産の種類: テンプレートを即座に表示
  • 生成型AIのタスク :検索拡張生成(RAG)
  • 対応言語 :英語

スコアと価値

相互ランク・メトリック・スコアは、関連するコンテクストが取得されたかどうか、また、それらがどこにランク付けされたかを示します。 スコアが高いほど、最初の関連コンテキストが上位にランク付けされていることを示します。 スコアが低いほど、関連性の高いコンテクストが低い順位にランク付けされていることを示します。

  • 値の範囲 : 0.0-1.0
  • 最高得点 : 1.0
  • 比率:
    • 0: 関連するコンテキストは取得されません
    • 1: 最初の関連文脈は最初の位置にある。

設定

  • しきいち:
    • 下限値:0
    • 上限:1

親トピック: 評価基準