資料の 英語版 に戻る

密度評価指標

最終更新: 2025年2月10日
密度評価指標

密度評価基準は、原文からの直接的な抽出に類似した抽出断片の平均を計算することで、 foundation model の出力における要約がモデル入力からどの程度抽出されているかを測定します。

メトリックの詳細

密度は、生成型AIの品質評価のためのコンテンツ分析指標であり、モデルの入力またはコンテキストに対するモデルの出力の評価を行います。

範囲

密度メトリックは、生成型AI 資産のみを評価します。

  • AI 資産の種類: テンプレートを即座に表示
  • 生成型AIのタスク
    • 検索支援強化型生成(RAG)
    • テキストの要約
  • 対応言語 :英語

スコアと価値

密度メトリックスコアは、モデル出力がどの程度抽象的であるか、また、抽出断片が原文からの逐語的抽出にどの程度類似しているかを示します。 スコアが低いほど、モデルの出力はより抽象的であり、平均して抽出された文章は原文の逐語的な抽出と類似していないことを示します。

値の範囲 : 0.0-1.0

設定

  • しきいち:
    • 下限値:0
    • 上限:1

親トピック: 評価基準