資料の 英語版 に戻る

テキスト品質評価指標

最終更新: 2025年3月07日
テキスト品質評価指標

テキスト品質の評価基準は、モデルの予測値と基準データに対して、 F1 スコア、精度、再現性を測定することで、 SuperGLUE データセットに対するモデルのアウトプットを評価します。

メトリックの詳細

テキスト品質は、生成 AI 資産タスクをどの程度適切に実行できるかを測定する生成 AI 品質評価メトリックです。

範囲

テキスト品質は、生成型AI 資産のみを評価します。

  • AI 資産の種類: テンプレートを即座に表示
  • 生成型AIのタスク
    • テキストの要約
    • コンテンツの生成
  • 対応言語 :英語

スコアと価値

テキスト品質の評価スコアは、予測と参照の類似性を示す。 スコアが高いほど、予測と参照の類似性が高いことを示します。

設定

  • しきいち:
    • 下限: 0.8
    • 上限:1

親トピック: 評価基準