Column
AIエージェントが失敗したとき、誰が責任を取るのか
自律的にツールを使い、タスクを実行する AIエージェントが引き起こした損害の責任帰属は、従来の法的枠組みでは解決できない。インタラクションログを証拠として活用する「Reasonable Agent」基準の提案が、AI導入企業のガバナンス設計に示す含意。
こんにちは。Affectosphere Group の井下です。
企業への AI エージェント導入が加速しています。
メールを自動送信し、外部 API を呼び出し、データベースを更新する。そういった「自律的な行動」をとれるシステムが、今や現場に普通に入ってきています。
便利なのは間違いない。ただ、「そのエージェントが何か問題を起こしたとき、誰が責任を負うか」という問いに、明確に答えられる組織はまだ少ないと思います。
2026 年 5 月に arXiv で公開された研究(Yiheng Yao、arXiv:2606.00518)は、この問いを法的な枠組みで整理しようとするものです。エージェント AI の不法行為責任(tort liability)に関するフレームワークを提案し、責任の所在を「インタラクションのパターン」によって分類しています。
法律の論文ではありますが、AI を導入する企業の実務に直結する内容です。
今日の 3 点
- エージェント AI の行動を「自律的逸脱」「純粋なツール使用」「協調的計画」の 3 パターンで分類し、責任帰属のルールが異なる。
- インタラクションログを法的証拠として活用する「Reasonable Agent」基準が提案されている。
- AI 導入企業はいまのうちにログ設計とシステム制約の記録を整備しておく必要がある。
① 3 パターンで責任が変わる
この研究のコアは、AI エージェントの行動を 3 つのパターンに分けているところです。
一つ目は「自律的な逸脱(autonomous deviation)」。ユーザーの意図や設計者の仕様から外れた行動をエージェントが独自にとった場合です。この場合、責任の主体は開発者・提供者側に傾きます。明示的な指示を超えた行動から生じた損害は、設計・訓練の問題として帰属される、というロジックです。
二つ目は「純粋なツール使用(pure tool use)」。エージェントが完全にユーザーの指示通りに動いている場合です。これは従来の「ツールの使用者責任」と近い構造で、ユーザー側の責任が大きくなります。
三つ目は「協調的計画(collaborative planning)」。ユーザーとエージェントが対話しながらタスクを進め、どこでどちらの意思決定が入ったか曖昧になるケースです。実際の AI エージェント利用で最も多いのはこのパターンだと思います。
この分類が重要なのは、「AI が失敗した」という事実だけでは責任の所在を決められないからです。どんな指示が与えられていたか、エージェントはどこで判断したか、ユーザーは何を承認したか——そのインタラクションの記録が問われます。
② 「Reasonable Agent」基準とは何か
この研究が提案するもう一つの概念が「Reasonable Agent」基準です。
法律の世界では「合理的な人間(reasonable person)」という基準が頻繁に使われます。ある行動が合理的な人間が取るであろう行動の範囲内かどうかを問うものです。
これを AI に適用したのが Reasonable Agent 基準です。同程度の能力・制約・コンテキストを持つ合理的な AI エージェントなら、同じ状況でどう行動しただろうか——その比較基準で、逸脱の有無と責任を判断しようというわけです。
この基準の実装上の含意は大きいです。「合理的な AI エージェントの行動」を問われるなら、エージェントが何を学習し、どんな制約を課されていたか、どんな指示を受けたか、その記録が全部証拠になる可能性があります。
インタラクションログは単なる運用データではなく、法的証拠として機能し得る——そういう時代が来ている、という話です。
③ 法務・コンプライアンス部門が今やるべきこと
ではこの研究の知見を踏まえて、AI 導入企業はいま何を準備すべきか。
まず、ログ設計を見直すことです。
現状、多くの AI エージェント実装では「何をしたか」のログは残していても、「どんな指示を受け、どんな承認フローを経たか」のインタラクションログが残っていないケースがあります。Reasonable Agent 基準が問うのはまさにその部分です。指示と行動の対応関係を追跡できる設計になっているか、確認が必要です。
次に、システム制約の文書化です。
エージェントに「できないこと」「してはいけないこと」を明示的に設定している場合、その設定と根拠を文書として残しておくことが重要です。自律的逸脱が起きたとき、「設計者は合理的な制約を課していた」という証拠になります。
三つ目が、責任帰属の事前合意です。
エンタープライズ向けに AI エージェントを販売する側も、導入する側も、「どのパターンの行動についてどちらが責任を負うか」を契約に明記する商慣習が必要になってきます。この研究の 3 分類は、そのための共通言語として使えます。
KPI として「エージェント起因のインシデント件数」だけでなく、「インシデント発生時の責任帰属の明確化率」を追うようになると、ガバナンス体制の成熟度が上がると思います。
ログは「責任の証拠」になる
AI エージェントが引き起こす問題は、これからもっと増えます。それは技術の進歩の必然的な側面です。
重要なのは、「問題が起きてから法的に争う」より、「問題が起きたとき誰が何をすべきかが事前に分かっている」状態を作っておくことです。
この研究が提供しているのはそのための枠組みです。3 分類とログ設計の示唆を、いまのうちに社内の AI ガバナンスポリシーに組み込んでおくことを勧めます。
では!
参考論文
- Yiheng Yao (2026). Acting with AI: An Interaction-Based Framework for Agentic Tort Liability. arXiv preprint.
※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。