Research
人間の感情理解
人間がそもそも感情をどう経験し、どう表現しているのか。心理学・認知科学・神経科学の知見を、AI研究の土台として読み直す。
取り組んでいること
感情は静的な属性ではなく、文脈・関係・時間の中で揺らぐ動的現象である。同じ発話に対して人々の判断は割れ、会話データでは7割以上のアノテーターが他者と異なる感情ラベルを付ける。にもかかわらず、機械学習の枠組みではこの不一致が「ノイズ」として平均化・多数決処理されてきた。本領域では、不一致をノイズではなく感情の主観性そのものを映すシグナルとして扱い、心理学が蓄積してきた感情理論を AI研究の土台として読み直す研究が広がっている。
分かってきていること
アノテーター不一致を保持したまま統計的に処理する枠組みは、心理学理論と整合する構造をデータから取り出せる可能性を示している。例えば、Plutchik 感情輪で隣接する感情間の遷移は過剰に観察される一方、価数が反転する遷移は抑制されるといった、感情ダイナミクスの理論的予測と一致するパターンが、複数の会話コーパスで再現されている。これは、人間の判断分布を尊重する統計設計が、心理学的に妥当な感情理解への新たな経路となりうることを示唆する。
Research notes
研究の物語
感情AIを構築する前提として、私たちは「人間がそもそも感情をどう経験し、どう表現しているのか」を理解しなければならない。心理学・認知科学・神経科学はこの問いに長い研究蓄積を持ち、感情を分類・記述・予測するための数多くの理論を提示してきた。本領域は、これらの理論的蓄積をAI研究の土台として読み直し、機械学習の設計に組み込むことを目指す。感情AIが単なる表面パターン学習に陥らず、人間の感情経験の構造を反映した予測を行うためには、心理学との対話が不可欠である。
心理学における感情理論には、いくつかの代表的な枠組みがある。Plutchik(1980)の感情輪は、喜び・悲しみ・怒り・恐れ・嫌悪・驚き・期待・信頼という8つの基本感情を円環状に配置し、隣接する感情の混合で複雑な感情が生まれると説明する。Gottman(1994)の対話分析は、夫婦間コミュニケーションを微細にコーディングし、特定の感情パターンが関係の崩壊を予測することを示した。Hatfield ら(1994)の感情伝染論は、人が他者の感情を表情・姿勢・声から自動的に模倣し、結果として自身の感情も影響を受けるという現象を理論化した。これらの理論は、感情がいかに動的で、関係的で、文脈依存的かを語っている。
ところが、感情AI研究の主流であるラベル付き学習は、こうした動的で関係的な感情経験を「離散ラベルへの分類問題」へと単純化してきた。同一発話に対する複数アノテーターの判断は集約され、多数派ラベルが「正解」とされる。しかし実際のデータを精査すると、会話コーパスではアノテーターの約7割が他者と異なる感情ラベルを選ぶことが分かっている。この食い違いは、アノテーターの不注意や能力不足ではなく、感情そのものが本来的に主観的・多義的であることの直接的な反映である。
近年、この不一致を「ノイズ」として消去するのではなく、「感情の主観性を映すシグナル」として保持し、確率分布として扱う視点が広がっている。学習データの真値を単一ラベルではなく確率分布で表現することで、モデルは「この発話は60%が喜び、30%が興奮、10%が驚きと判断された」という人間判断の揺らぎそのものを学習対象にできる。これにより、機械学習が「正解か不正解か」の二択ではなく、「人間判断の分布をどれだけ忠実に再現できるか」を目指せるようになる。
Bayesian Spectral Emotion Transition Discovery from Multi-Annotator Disagreement(BSETD, 2026)は、この方向性を会話中の感情遷移分析へ拡張したベイズ的フレームワークである。BSETDは三段階で構成される。第一段階では、複数アノテーターの判断分布を階層 Dirichlet-Multinomial モデルで保持し、感情間の遷移確率行列の事後分布を推定する。これにより「ある感情から別の感情への移り変わりやすさ」を、点推定ではなく確率分布として扱う。
第二段階では、推定された遷移行列をグラフラプラシアン(グラフ上の構造を解析する数学的演算子)として扱い、そのスペクトル分解(固有値・固有ベクトル分解)を行う。これにより、感情遷移のダイナミクスを「持続(自分自身の感情がどれだけ慣性で続くか)」と「伝染(他者の感情にどれだけ影響を受けるか)」という、心理学的に意味のある二成分に数学的に分離できる。スペクトル分解は信号処理や物理学で広く用いられる手法だが、本研究はそれを感情の時系列力学に応用した。
第三段階では、得られた成分を心理学理論と照合する。EmotionLines を含む5つの会話コーパスで分析した結果、嫌悪→怒りのように Plutchik 感情輪で隣接する遷移が過剰に観察される一方、喜び↔怒りのように価数(快-不快の方向)が反転する遷移は明確に抑制された。さらに、Gottman の対話分析が予測する「関係崩壊型の感情遷移パターン」も検出された。アノテーター不一致を情報として扱う設計が、Plutchik 感情輪・Gottman 対話分析・Hatfield 感情伝染論といった心理学的予測と整合する構造を、データから初めて統計的に取り出せたことを示している。
本領域の研究が示唆するのは、「人間判断の分布を尊重する統計設計」が、心理学的に妥当な感情理解への新たな経路となりうるということである。アノテーターの判断のばらつきは、計測誤差ではなく、人間集団における感情解釈の多様性そのものである。それを保持したまま統計処理することで、AI は「平均的な人間が下す判断」ではなく、「人間集団が示す解釈の分布」を学習対象にできる。本領域は、感情の主観性を尊重した次世代の感情AIの基礎をつくる土台研究として位置づけられる。