資料の英語版に戻る

テキスト品質評価指標

最終更新: 2025年3月07日

テキスト品質評価指標

テキスト品質の評価基準は、モデルの予測値と基準データに対して、 F1 スコア、精度、再現性を測定することで、 SuperGLUE データセットに対するモデルのアウトプットを評価します。

メトリックの詳細

テキスト品質は、生成 AI 資産タスクをどの程度適切に実行できるかを測定する生成 AI 品質評価メトリックです。

範囲

テキスト品質は、生成型AI 資産のみを評価します。

AI 資産の種類: テンプレートを即座に表示
生成型AIのタスク ：
- テキストの要約
- コンテンツの生成
対応言語 ：英語

スコアと価値

テキスト品質の評価スコアは、予測と参照の類似性を示す。スコアが高いほど、予測と参照の類似性が高いことを示します。

設定

しきいち：
- 下限： 0.8
- 上限：1

親トピック： 評価基準

トピックは役に立ちましたか?

0/1000