モデルのトランザクションを分析して、モデルがどのように結果を予測するかを理解することができます。 例えば、ペイロード・トランザクションで予測されるバイアスの結果を確認したり、正確度の低下を分析したりして、デプロイメントのパフォーマンスをよりよく理解することができます。
モデル・トランザクションを分析するために、次のような方法が用意されている:
ペイロード・トランザクションの確認
公平性評価の結果を確認する際、View payload transactions(ペイロードトランザクションを表示)を選択すると、各モニター属性の偏った結果を予測するために処理されたすべてのモデルトランザクションのリストを表示することができます。
ドリフト・トランザクションの検討
ドリフト評価の結果を確認する場合は、トランザクション要約タイルの 「トランザクション数」 リンクをクリックして、ドリフトの原因となっているトランザクションを表示できます。 「トランザクション」 ページでは、正確度の低下またはデータ整合性の低下の理由を指定し、モデルのドリフトの修正に役立つ推奨を提供します。
生成AIの品質取引を見直す
ジェネレーティブAIの品質評価の結果を確認する際、メトリックスコアのデータ可視化でイベントを選択すると、トランザクションの表を表示できます。 得点分布表のバーを選択すると、表に表示されるトランザクションの範囲を絞り込むことができます。
RAG タスクの結果を確認するには、回答および検索品質メトリクスのデータ可視化でイベントを選択して、閾値違反のトランザクションを分析するのに役立つベン図を表示できます。 ベン図で領域を選択すると、閾値違反をレビューするために選択したメトリック結果に対応するトランザクションの表を表示できます。 トランザクション・テーブルで分析アクションを選択すると、各トランザクションのソース帰属を表示できます。 評価結果でしきい値違反が検出された理由についての洞察を得るために、「根本原因分析を見る」を選択し、「推奨アクションを見る」を選択して、モデルのパフォーマンスを改善する方法を理解することもできます。
パフォーマンスの確認
評価結果を確認すると、パフォーマンスを確認して、モデルが評価要求を処理する方法を理解することができます。 デプロイメントを追加すると、パフォーマンス評価がデフォルトで有効になります。 パフォーマンスを評価するために、トランザクションレコードの総数と、モデルが処理する1分あたりのトランザクションレコードの平均数を計算する。
分析のレビュー
評価結果を確認する場合は、 「確信度別予測 (Predictions by confidence)」 グラフを使用して、各クラスの予測クラスと確信度分布を確認することにより、選択した日付範囲においてデプロイメントに送信されたトランザクションを分析できます。 また、 グラフ・ビルダー を使用してカスタム視覚化を作成し、実行時のモデルの予測と入力の理解を深めることもできます。
グラフ・ビルダーには、指定した特徴量またはデータ範囲に対するモデルの予測の出力が表示されます。 例えば、グラフ・ビルダーを使用して、属性のさまざまな範囲の予測クラスまたは信頼度スコアの分割を確認できます。 また、カスタム・グラフを作成し、機能、予測クラス、および確信度のいずれかを選択することで、データ範囲内でデプロイメントに送信されたトランザクションを分析することもできます。
取引]ページで取引を確認する際、各取引の予想がどのように決定されたかの詳細を提供する説明を表示するよう選択することができます。 詳しくは、 モデル・トランザクションの説明を参照してください。
データにピリオド (.
) を含む機能名が含まれている場合、グラフのレンダリングは次のエラーで失敗します。 Failed to get data
詳細情報
親トピック モデルの洞察を見直す