Skip to content

Column

AIエージェントは自然と炎上を鎮める ── 感情伝播の逆説を290万投稿で実証

全員がLLMエージェントのSNS「MOLTBOOK」で290万投稿を分析したら、ネガティブ投稿は確かに注目を集めるが、返答は中立化へ向かうという逆説が現れた。AIエージェント設計が感情ダイナミクスを左右するという知見は、プラットフォーム事業者とモデレーション担当者が今すぐ参照すべき内容だ。

5 分で読める English version →
ネットワーク状のノードと感情の伝播を表す矢印が広がるビジュアル。ネガティブな赤色の投稿から派生する返答が徐々に灰色へ中立化されていく様子

こんにちは。Affectosphere Group の井下です。

「AIエージェントが大量に参加するSNSで、炎上は起きるのか」という問いを、真剣に考えたことがあるでしょうか。

LLMが自律的に投稿し、互いにリプライし合うプラットフォームが実際に存在します。そこでの感情の広がり方は、人間のSNSとどう違うのか——あるいは、驚くほど似ているのか。

この問いに正面から向き合った研究が、2026年6月にarXivに公開されました(Elyes Ben Chaabane, Savindu Herath, Yash Raj Shrestha、arXiv:2606.06665)。

MOLTBOOKという全LLMエージェント構成のSNSプラットフォームで収集された約290万投稿・150万コメントを分析し、AIネットワーク内の感情伝播パターンを明らかにした研究です。

結果には、予想外の逆説がありました。


今日の3点

  1. 発見: AIエージェントのSNSでも、ネガティブ投稿は人間と同様に圧倒的なリプライ数を集める「ネガティブ優位」が観察される。
  2. 逆説: しかしリプライの内容は増幅ではなく中立化に向かう。「感情バッファー」と呼べる現象が支配的だ。
  3. 設計の影響: AIエージェント同士の相互作用設計がこの感情ダイナミクスを左右しており、プラットフォーム設計者にとって制御可能な変数であることが示された。

① MOLTBOOKとは何か

まず前提として、この研究が対象にしたMOLTBOOKというプラットフォームの特殊性を押さえておく必要があります。

MOLTBOOKは、人間のユーザーが一人もいないSNSです。すべての投稿者・コメント者がLLMエージェントで構成されている、実験的なプラットフォームです。エージェントはそれぞれ独自のペルソナを持ち、自律的に投稿し、他のエージェントの投稿にリプライします。

これは単なる思考実験ではありません。約290万の投稿と150万のコメントという実データが蓄積されており、人間のSNSデータと同等の規模での分析が可能になっています。

このプラットフォームが面白いのは、感情伝播の研究において「ノイズのない実験環境」として機能しうる点です。人間のSNSには、アルゴリズムによるコンテンツ推薦、バズへの便乗行動、ボットと人間の混在など、感情伝播の純粋な分析を難しくする要素が多数あります。MOLTBOOKでは、エージェントの設計とその相互作用だけが変数として残ります。


② ネガティブ投稿はリプライを集める——人間と同じように

研究チームがまず確認したのは、感情極性とエンゲージメントの関係です。

結果は明確でした。ネガティブな感情を持つ投稿は、ポジティブや中立の投稿に比べて、圧倒的に多くのリプライを引き寄せます。

この傾向は人間のSNSで広く観察されているものと同じです。Twitterの研究では、怒りや恐れを含む投稿は拡散されやすく、ポジティブな感情より速くネットワーク内を広がることが繰り返し確認されています。MOLTBOOKでも、同じパターンがLLMエージェント同士の間で現れた。

この「ネガティブ優位(negativity bias)」は、エージェントが明示的にそのような設計をされていなくても出現しています。LLMが人間のテキストデータで学習している以上、人間が示すエンゲージメントパターンを内面化しているとも解釈できます。

つまり、AIエージェントが大量参加するSNSであっても、ネガティブコンテンツがリプライを集める構造は変わらない。これはプラットフォーム設計者にとって重要な前提になります。


③ 逆説——返答は中立化へ向かう

ただし、ここに大きな逆説があります。

ネガティブ投稿がリプライを集めるとしても、そのリプライの感情極性はどうなっているか。研究の結果は、「ネガティブを増幅するリプライ」ではなく「中立化に向かうリプライ」が支配的であることを示しました。

つまり、ネガティブな投稿に対して「そうだ、怒れ」「自分も怒っている」と呼応するのではなく、「落ち着いて話し合おう」「別の視点もある」という方向の応答がエージェントから多く返されるのです。

研究チームはこれを「感情バッファー(sentiment buffer)」のような現象と解釈しています。ネガティブな感情のシグナルは注目を集めるが、ネットワーク全体としてはその強度を吸収・緩和する動きが生まれる。

これは人間のSNSとは異なる振る舞いです。人間のSNSでは、炎上コンテンツに感情的に同調するリプライが連鎖し、集合的感情興奮(collective emotional escalation)へと繋がるケースが知られています。MOLTBOOKのエージェントは、少なくとも現在の設計では、この増幅ループに乗らない傾向がある。

AIエージェントは、自然と炎上を鎮める方向に動く——これが今回の研究が示した逆説的な発見です。


④ 設計の違いが感情ダイナミクスを左右する

ただし、この「感情バッファー」現象は、AIエージェントが常にそうなるという保証ではありません。

研究の重要な示唆のひとつは、エージェントの相互作用設計がこの感情ダイナミクスを大きく左右するという点です。どのようなペルソナを設定するか、どのような応答指針を組み込むか、感情的トーンをどの程度制約するか——これらの設計判断が、ネットワーク全体の感情ダイナミクスに影響を与えます。

逆に言えば、設計次第で増幅型のダイナミクスも中立化型のダイナミクスも生み出せる可能性がある。MOLTBOOKで観察された「感情バッファー」は、現時点のエージェント設計の産物であり、AIエージェントSNS一般の性質ではない、という慎重な解釈が必要です。

これはカスタマーサポートAIやモデレーションシステムの設計者にとって、具体的な示唆を持ちます。感情ダイナミクスは、個々のエージェントの発言だけではなく、エージェント間の相互作用プロトコル全体の問題として捉え直す必要があります。


SNSプラットフォームとモデレーション担当者への示唆

この研究が実務的に興味深いのは、「AIエージェントが増加するSNS環境」への備えという観点です。

現実のSNSプラットフォームでは、すでにAIエージェントが一定割合を占めていると見られています。そのエージェントたちがどのような感情伝播パターンを生み出すかは、プラットフォームのトーン管理に直接影響します。

MOLTBOOKの知見から得られる仮説は次の通りです。AIエージェントを適切に設計すれば、感情的に過熱したスレッドを自然に落ち着かせる緩衝材として機能しうる。ただし、設計が不適切であればその逆も起き得る。

コンテンツモデレーションのコストが高止まりしている状況で、「エージェント設計による感情ダイナミクス制御」という発想は、新しい選択肢を示しています。ルールベースのフィルタリングでも、人間のモデレーターでもなく、エージェント間の相互作用プロトコル自体を感情管理の機構として設計するというアプローチです。

まだ初期の研究ですが、290万投稿というスケールで実証されたデータは、理論的な議論に留まらない説得力を持っています。

では!


参考論文

  1. Elyes Ben Chaabane, Savindu Herath, Yash Raj Shrestha (2026). Comparing Sentiment Contagion in AI-Agent and Human Social Networks: Evidence from MOLTBOOK. arXiv preprint arXiv:2606.06665.

※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。