Column

自動運転に「ルールと直感」を両立させた LLM フレームワーク ── 解釈可能性の新しい形

強化学習だけでも、LLM だけでも越えられなかった自動運転の壁を、ルールベース意思決定と LLM の組み合わせが突破した。解釈可能性・応答速度・走行性能を同時に達成した ADRD の話を、自動車・モビリティ担当者向けに 5 分で。

2026 / 06 / 01 5 分で読める English version →

車が走る抽象的な俯瞰図。左にルールのフローチャート、右に LLM の思考バブル、中央で統合される

こんにちは。Affectosphere Group の井下です。

自動運転を担当している方と話していると、こういう場面に必ずぶつかります。

「LLM を入れれば柔軟になる。でも何をもとに判断しているか分からなくなる」。

「強化学習モデルは安定しているが、想定外のシナリオで変な動きをする」。

「現場の安全担当者が、AI の判断を説明できないとOKを出せない」。

自動運転の AI は、「賢さ」と「透明性」のトレードオフに長い間縛られてきました。LLM に傾けば説明が難しくなる。ルールベースに傾けると柔軟性が落ちる。この二者択一が業界の基本的な構図でした。

2026 年に arXiv で公開された研究（Fanzhi Zeng, Siqi Wang, Chuzhao Zhu, Li Li、2506.14299）は、この構図を打破する試みを報告しています。LLM と規則ベース意思決定システムを統合した「ADRD」フレームワークで、強化学習・既存 LLM 手法より解釈可能性・応答速度・走行性能の 3 点で優れることを示しました。

今日はこの研究の内容を、自動車・モビリティ・安全系エンジニア向けに整理します。

今日の 3 点

価値: ルールベースの「確実性」と LLM の「柔軟性」を組み合わせることで、解釈可能性・速度・性能を同時に達成。
ADRD の 3 コンポーネント: 情報モジュール・エージェントモジュール・テストモジュールの分業がなぜ機能するか。
「LLM 単体」との差: LLM だけに任せると何が崩れるのか、ADRD が何を補完するのか。

① 「ルールと LLM」という組み合わせの発想

まず前提を整理します。

自動運転の意思決定システムには、大きく分けてこういうアプローチの歴史があります。

ルールベース（古典的アプローチ）: 「この状況ではこの行動をする」というルールを人間が書く。透明性は高いが、ルールが想定していない状況（edge case）に弱い。

強化学習: 環境との相互作用を通じて最適行動を学習。edge case への適応力は高いが、「なぜその判断をしたか」が説明しにくい。

LLM 単体: 自然言語での指示理解・文脈推論が強い。状況説明や複雑な意図の解釈には優れているが、リアルタイム応答速度と一貫性の担保が難しい。

ADRD（Zeng ら 2026）はこれらを組み合わせた「ハイブリッド」です。論文は「LLM と規則ベースシステムの最初の統合」と位置づけており、実世界展開可能性を強調しています。

② ADRD の 3 コンポーネント

ADRD は 3 つのモジュールで構成されています。

情報モジュール（Information Module）

走行文脈を収集・整理するモジュールです。センサーデータ、周囲の車・歩行者の動き、道路状況、交通規則の適用状況など、意思決定に必要な情報を構造化して整備します。

「今どういう状況か」を LLM に渡せる形に変換するのがこのモジュールの仕事です。生の sensor データを LLM に投げても意味のある推論はできない。整理された文脈情報として渡すことで、LLM が有用な判断を出せるようになります。

エージェントモジュール（Agent Module）

LLM が戦術的判断を行うコアモジュールです。情報モジュールから受け取った文脈を元に、「この状況では車線変更すべきか」「この歩行者は道を渡ろうとしているか」などの判断を生成します。

ここで重要なのは、LLM が「戦術」を出すのに対し、「実行」は規則ベースシステムが担う点です。LLM の判断結果を規則ベースのフィルターに通すことで、法令違反・物理的な不可能判断・危険な行動が自動的に除外されます。

テストモジュール（Test Module）

反復改善を行うモジュールです。エージェントモジュールが出した判断をシミュレーション環境でテストし、フィードバックを返す。うまくいかなかった判断のケースを蓄積して、次回以降の判断品質を改善します。

これは「LLM 単体」では難しい仕組みです。LLM は同じ入力でも出力がブレるため、安全が必要な文脈では「試して改善する」ループを仕組みとして持つことが重要です。

③ 既存アプローチとの比較

論文は ADRD を強化学習ベースのシステムおよび既存 LLM 手法と比較し、3 軸での優位性を報告しています。

解釈可能性: 規則ベースシステムとの組み合わせにより、「なぜその判断をしたか」を後から追跡できる。LLM 単体では難しかった説明可能性が、ルールとの組み合わせで確保できる。

応答速度: LLM の判断を「複雑な文脈理解が必要な場面」に絞り込むことで、全体的な処理速度を向上させている。簡単なルール適用ケースは規則ベースが即時処理する。

走行性能: edge case への対応力が向上。LLM が柔軟な判断を出し、ルールベースがその安全性を保証するという分業が、想定外シナリオでの性能を引き上げている。

「解釈可能性・速度・性能をすべて同時に改善する」というのは、従来のアプローチでは難しかった主張です。それが実験で支持されているというのが、この研究の核心的な貢献です。

自動運転 AI の評価軸が変わる

このフレームワークが示す方向性は、自動運転 AI の評価軸の変化と重なります。

「モデルの精度」だけで AI を評価する時代は終わりつつあります。安全性と説明可能性が規制要件として入ってくる中で、「なぜこの判断をしたか説明できるか」「万が一の時にどこが壊れたか分かるか」という問いが、製品選定の基準に入ってくるからです。

ADRD のアプローチは、この方向に真正面から答えようとしています。「LLM の賢さと、ルールベースの説明可能性を組み合わせる」という設計思想は、安全要件の厳しい産業 AI の実装において、汎用的な参照点になりえます。

自動運転の次の競争軸は、「どれだけ賢いか」から「どれだけ説明できる賢さか」に移っているかもしれません。

では！

参考論文

Fanzhi Zeng, Siqi Wang, Chuzhao Zhu, Li Li (2026). ADRD: LLM-Driven Autonomous Driving Based on Rule-based Decision Systems. arXiv preprint.

※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。