0 / 0

AI リスク・アトラス

最終更新: 2025年5月30日
AI リスク・アトラス
リスクアトラス・ランディングページの背景画像

このアトラスで、エージェント型AI、ジェネレーティブAI、機械学習モデルを扱うリスクを理解しよう。

トップに戻る

エージェント型AIの新たなリスクと増幅

エージェント型AIの新たなリスクと増幅の背景イメージ

リスクは、以下のいずれかのタグで分類されます。

エージェント型AIによる増幅
エージェント型AIによってより深刻になる、あるいはその可能性が高いリスク。
エージェント型AIに特有
エージェント型AIに特有のリスク。

AIエージェントとは、AIの技術を採用し、設定された目標に基づいて環境内で行動するエージェンシーを持つソフトウェア・エンティティである。 エージェント型AIシステムとは、AIエージェント(ツール、プランナー、メモリー、データセットなど他のコンポーネントとともに)を活用し、目標を追求し、自律的に動作するソフトウェアシステムである。

AIエージェントは3種類のアクションを行うことができる:

  • 世界(物理的またはデジタル)に影響を与える行動をとる。
  • リソースを参照し、ツールを使用する。
  • リソース/ツール/他のAIエージェントの選択において、どのプロセスを選択するかを決定し、それらを選択する。

このセクションのリスクは、エージェント型AIに特有のもの、あるいはエージェント型AIによって増幅されるものである。 最近のエージェントは大規模な言語モデルの上に構築されているため、 次節の生成AIのリスクはエージェント型AIにも適用できる可能性がある。

フェアネス 公正リスクを表すアイコン。

フェアネス

差別的行為
エージェント型AIによる増幅
データの偏りを導入する
エージェント型AIによる増幅
プライバシー プライバシーリスクを表すアイコン。

プライバシー

IP/PI/機密情報のユーザーとの共有
エージェント型AIによる増幅
IP/PI/機密情報のツールとの共有
エージェント型AIに特有

価値の調整

AIエージェントへの過度の依存、あるいは過少な依存
エージェント型AIによる増幅
ずれた行動
エージェント型AIによる増幅
堅牢性 ロバストネス・リスクを表すアイコン。

堅牢性

AIエージェントの外部リソースへの攻撃
エージェント型AIに特有
不正使用
エージェント型AIによる増幅
信頼の不一致を突く
エージェント型AIによる増幅
ハルシネーション呼び出す機能
エージェント型AIに特有
計算効率の悪さ 計算効率の悪さを表すアイコン。

計算効率の悪さ

冗長なアクション
エージェント型AIに特有
ガバナンス ガバナンス・リスクを表すアイコン。

ガバナンス

不完全なAIエージェントの評価
エージェント型AIによる増幅
緩和とメンテナンス
エージェント型AIによる増幅
AIエージェントの透明性の欠如
エージェント型AIによる増幅
再現性
エージェント型AIに特有
AIエージェントの行動の説明責任
エージェント型AIによる増幅
AIエージェントのコンプライアンス
エージェント型AIによる増幅
社会的影響 社会的影響リスクを表すアイコン。

社会的影響

人間の尊厳への影響
エージェント型AIによる増幅
AIエージェントが人間のエージェンシーに与える影響
エージェント型AIによる増幅
AIエージェントが雇用に与える影響
エージェント型AIによる増幅
AIエージェントが環境に与える影響
エージェント型AIによる増幅
説明可能性 説明可能性のリスクを表すアイコン。

説明可能性

説明不可能で追跡不可能な行動
エージェント型AIによる増幅
エージェント型AIの新たなリスクと増幅の背景イメージ

リスクは、以下のいずれかのタグで分類されます。

AIの伝統的リスク
従来のモデルと生成モデルの両方に適用される、AIの確立されたリスク。
ジェネレーティブAIによる増幅
ジェネレーティブAIによって、より深刻になる、あるいはその可能性が高くなるリスク。 こうしたリスクは、従来のAIモデルにも当てはまる。
生成AIに特有
ジェネレーティブAIモデルに特に関連するリスク。

以下のリスクは、ジェネレーティブAIモデルと伝統的(非ジェネレーティブ)AIモデルに適用可能なリスクについて説明している。 これらのリスクは、エージェント型AI、特にエージェントの行動や出力が生成モデルや伝統的なAIモデルを用いて決定される場合にも適用される可能性がある。

トレーニングデータのリスク

整合 アライメント・リスクを表すアイコン。

正確性

代表的でないデータ
AIの伝統的リスク
データの汚染
ジェネレーティブAIによる増幅
フェアネス 公正リスクを表すアイコン。

フェアネス

データの偏り
ジェネレーティブAIによる増幅

価値の調整

不適切なデータキュレーション
ジェネレーティブAIによる増幅
不適切な再教育
ジェネレーティブAIによる増幅
堅牢性 ロバストネス・リスクを表すアイコン。

堅牢性

データ・ポイズニング
AIの伝統的リスク
プライバシー プライバシーリスクを表すアイコン。

プライバシー

データ内の個人情報
AIの伝統的リスク
再識別
AIの伝統的リスク
データ・プライバシー権の調整
ジェネレーティブAIによる増幅
透明度 透明性リスクを表すアイコン。

透明度

トレーニングデータの透明性が欠けている
ジェネレーティブAIによる増幅
データの出所が不明
ジェネレーティブAIによる増幅
データ法 データ法のリスクを表すアイコン。

データ法

データ取得の制限
ジェネレーティブAIによる増幅
データ使用制限
AIの伝統的リスク
データ転送の制限
AIの伝統的リスク
知的財産 知的財産リスクを表すアイコン。

知的財産

データ内の機密情報
ジェネレーティブAIによる増幅
データ使用権の制限
ジェネレーティブAIによる増幅

推論のリスク

整合 アライメント・リスクを表すアイコン。

正確性

モデルの精度が低い
ジェネレーティブAIによる増幅
堅牢性 ロバストネス・リスクを表すアイコン。

頑健性:モデルの挙動操作

回避攻撃
ジェネレーティブAIによる増幅
抽出攻撃
ジェネレーティブAIによる増幅
ジェイルブレイク
生成AIに特有
知的財産 知的財産リスクを表すアイコン。

知的財産

プロンプト内の IP 情報
生成AIに特有
プロンプトでの機密データ
生成AIに特有
堅牢性 ロバストネス・リスクを表すアイコン。

堅牢性:迅速な攻撃

プロンプト・インジェクション攻撃
生成AIに特有
プロンプト・リーク
生成AIに特有
プロンプトの準備
生成AIに特有
コンテキスト・オーバーロード攻撃
生成AIに特有
直接指示攻撃
生成AIに特有
暗号化された相互作用攻撃
生成AIに特有
間接指示攻撃
生成AIに特有
ソーシャルハッキング攻撃
生成AIに特有
特殊トークンの攻撃
生成AIに特有
プライバシー プライバシーリスクを表すアイコン。

プライバシー

プロンプトでの個人情報
生成AIに特有
属性推論攻撃
ジェネレーティブAIによる増幅
メンバーシップ推論攻撃
ジェネレーティブAIによる増幅

出力リスク

フェアネス 公正リスクを表すアイコン。

フェアネス

決定バイアス
AIの伝統的リスク
出力バイアス
生成AIに特有

価値の調整

有害な出力
生成AIに特有
有害なコード生成
生成AIに特有
有毒な出力
生成AIに特有
不完全なアドバイス
生成AIに特有
過信または不信
ジェネレーティブAIによる増幅
誤用 誤用リスクを表すアイコン。

誤用

危険な使用
生成AIに特有
ディスインフォメーションの配分
生成AIに特有
非同意使用 (Nonsensual use)
生成AIに特有
毒性の拡散
生成AIに特有
不正利用
ジェネレーティブAIによる増幅
非公開
生成AIに特有
堅牢性 ロバストネス・リスクを表すアイコン。

堅牢性

幻覚
生成AIに特有
プライバシー プライバシーリスクを表すアイコン。

プライバシー

個人情報の暴露
ジェネレーティブAIによる増幅
知的財産 知的財産リスクを表すアイコン。

知的財産

著作権侵害
生成AIに特有
機密情報の公開
ジェネレーティブAIによる増幅
説明可能性 説明可能性のリスクを表すアイコン。

説明可能性

説明できない出力
ジェネレーティブAIによる増幅
信頼できないソース属性 (Unreliable source attribution)
生成AIに特有
追跡不能属性 (Untraceable attribution)
ジェネレーティブAIによる増幅
アクセス不能なトレーニング・データ
ジェネレーティブAIによる増幅

非技術的リスク

ガバナンス ガバナンス・リスクを表すアイコン。

ガバナンス

データ透過性の欠如
ジェネレーティブAIによる増幅
Lack of model transparency (モデル透過性の欠如)
AIの伝統的リスク
システムの透明性が欠けている
AIの伝統的リスク
使用法の定義が不完全
生成AIに特有
誤ったリスク検査
ジェネレーティブAIによる増幅
代表的でないリスクテスト
ジェネレーティブAIによる増幅
テストの多様性が欠けている
ジェネレーティブAIによる増幅
法的コンプライアンス アイコンは法令遵守リスクを表す。

法的コンプライアンス

モデル使用権の制限
AIの伝統的リスク
法的説明責任
ジェネレーティブAIによる増幅
生成コンテンツの所有権とIP
生成AIに特有
社会的影響 社会的影響リスクを表すアイコン。

社会的影響

環境への影響
ジェネレーティブAIによる増幅
影響を受けるコミュニティへの影響
AIの伝統的リスク
ヒューマン・エクスプロイト
ジェネレーティブAIによる増幅
雇用への影響
ジェネレーティブAIによる増幅
AIエージェントが人間のエージェンシーに与える影響
ジェネレーティブAIによる増幅
国/地域別情報の多様性への影響
生成AIに特有
教育への影響:学習の回避
生成AIに特有
教育への影響:盗作
生成AIに特有