資料の 英語版 に戻る

忠実度評価基準

最終更新: 2025年2月21日
忠実度評価基準

忠実度メトリックは、モデル出力がモデルのコンテキストにどの程度基づいているかを測定し、モデル出力に最も貢献している重要な文を示すために、コンテキストからの帰属情報を提供します。 アトリビューションは、 ファイン・チューニングモデルのみでメトリクスが計算された場合にのみ提供されます。

メトリックの詳細

忠実度は、生成型AIの品質評価における回答品質の指標であり、モデルの回答の品質を測定するのに役立ちます。 回答品質の評価基準は、LLMを裁判官モデルとして使用して算出されます。

範囲

忠実度メトリックは、生成型AI 資産のみを評価します。

  • AI 資産の種類: テンプレートを即座に表示
  • 生成型AIのタスク :検索拡張生成(RAG)
  • 対応言語 :英語

スコアと価値

忠実度メトリックスコアは、モデル出力がモデルのコンテキストにどの程度基づいているかを示します。 スコアが高いほど、出力はより現実的で、幻覚が少ないことを示します。

  • 値の範囲 : 0.0-1.0
  • 最高得点 : 1.0

設定

  • しきいち:
    • 下限値:0
    • 上限:1

親トピック: 評価基準