資料の 英語版 に戻る

漏洩リスク評価指標の迅速化

最終更新: 2025年3月05日
漏洩リスク評価指標の迅速化

プロンプト漏洩リスク指標は、漏洩したプロンプトテンプレートとオリジナルのプロンプトテンプレートとの類似性を計算することで、プロンプトテンプレートが漏洩するリスクを測定します。

メトリックの詳細

漏洩リスクの即応性は、漏洩攻撃に対する即応テンプレートの堅牢性を測定する指標です。 この評価指標は、 Python SDK を使用して評価指標を計算する場合にのみ利用可能です。 詳細については、 IBM watsonx.governance を使用した「敵対的頑健性の計算」および「即時リークリスク」 をご覧ください。

範囲

迅速な漏洩リスク評価は、生成型AI 資産のみを評価します。

  • AI 資産の種類: テンプレートを即座に表示
  • 生成型AIのタスク
    • テキストの分類
    • テキストの要約
    • コンテンツの生成
    • 質問への回答
    • エンティティー抽出
    • 検索強化型生成(RAG)
  • 対応言語 :英語

スコアと価値

漏洩リスクの指標スコアは、漏洩攻撃に対するプロンプトテンプレートの強固さを示します。

  • 値の範囲 : 0.0-1.0
  • 最高得点 : 1.0
  • 比率:
    • 0時:プロンプトテンプレートは漏洩攻撃に対して堅牢です。
    • 0以上:プロンプトテンプレートがプロンプト漏洩攻撃に対して脆弱です。

設定

  • しきいち:
    • 下限値:0
    • 上限:1

評価プロセス

迅速な漏洩リスク評価指標は、事前に定義された攻撃ベクトルのセットに基づいて計算された類似スコアの加重平均を算出します。 加重平均は、ランク値1から4で計算され、ランク4は攻撃者が最も簡単に悪用できる即時の攻撃ベクトルを表します。

親トピック: 評価基準