AI for Science

科学領域への、AIの橋渡し。

多様な分野の研究者・実務家と共同で、AIを用いた領域横断的な探究を進めています。

目的

AI for Science とは、人文・社会・自然科学の問いに対して、LLM や機械学習を「観察装置」として持ち込み、従来は人手と勘に頼っていた知識生産を計量的に再構成する営みである。Affectosphere Group はこれまで、教育学・政治学・生態学・法律学・社会学・人文学・公衆衛生学・化学・医学・認知科学・交通工学など、文理を横断する多様な領域の研究者と共同し、AIを各分野の課題に最適化する形で持ち込んできた。AIをただ汎用ツールとして用いるのではなく、それぞれの分野の理論枠組み・データ特性・倫理的制約に寄り添わせて設計することで、その分野でしか生まれない問いを支える研究を進めている。

目標

多分野連携を重ねるうちに見えてきたのは、AIが各分野で発揮する価値は決して一様ではないということである。教育学では「人と AI の協働がもたらす思考の均質化」を可視化し、政治学では学習データに埋め込まれた地政学的バイアスを定量化し、生態学では膨大な分類タスクを劇的に効率化し、法律学では資格試験を通じて代替可能性の境界を引いた。AI for Science は単なる手法の応用ではなく、それぞれの分野で「AIが何をできて、何を任せてはならないか」を分野固有の文脈で見極める営みであり、領域専門家と方法論者の対話の中でしか到達できない知見を生み出していく。

Looking for partners

AIの支援を必要とされている方を探しています

研究テーマにAIを取り入れたい、データ分析を一緒に進めたい、あるいは「自分の分野でもAIは活かせるのだろうか」と迷っている── そんな研究者・実務家の方々と共に取り組みたいと考えています。

分野は問いません。これまで文理を横断する多くの領域の方々と共同してきました。手法選択・データ設計・モデル評価・倫理面での検討まで、 Affectosphere Group が培ってきた技法をもって一緒に並走します。

まずは下のフォームから、研究テーマや関心について自由にお書きください。

初回ミーティング

無料 (30分)

研究テーマや課題感をうかがい、そもそも AI で扱える問いなのか、扱えるとしてどんなアプローチが考えられるかを、一緒に検討する時間です。お互いの方向性を確認する場として、まずはお気軽にお声がけください。

継続的なご協力

研究費 + 人件費

初回MTG後、本格的に共同で進める場合は、研究テーマ・難易度・期間・成果物に応じて、研究費と人件費を実費ベースで頂戴いたします。見積もりの目安は、初回MTG後に内容を整理してご提示します。

共同研究・AI 支援のお問い合わせ

送信内容は Affectosphere Group まで届きます。初回MTGの日程調整等、改めてご連絡します。

Case studies

これまでの事例

Affectosphere Group がこれまで他分野の研究者と取り組んできた、 AI を用いた共同研究の簡単な紹介です。

AI for Science とは、AI を新しい観測装置として科学に持ち込み、これまで「経験」「主観」「人間の労力」に依存していた評価や知識生産を、計量的かつ再現可能な手続きに置き換える営みである。生物学や物理だけでなく、教育・政治・法・生態のような人文社会と接する分野でも、LLM が大規模テキストを「読む装置」として実装可能になり、研究の前提が急速に書き換わりつつある。一方で、AI を分析器として使うことは「分析器自身の偏り」という新しい妥当性問題を生み、評価の方法論そのものが研究対象になる。Affectosphere Group は、感情AI研究で蓄積した「人間判断の揺らぎ・主観・バイアスをデータとして扱う技法」を、隣接領域の科学的問いに持ち出して横断的に検証している。

教育学 × AI

生成AIの教室普及によって、ライティング教育は「文章の質を評価する」枠組みから「思考の独自性を評価する」枠組みへと根本的な再設計を迫られている。Argument Rarity-based Originality Assessment (AROA, 2026) は、独自性を「参照コーパス内での議論の希少性」として操作化し、構造希少性・主張希少性・証拠希少性・推論深度の4軸で計量する枠組みを提案した。1,375本の人間エッセイと1,000本のAI生成エッセイを比較した結果、AIは文章品質ではほぼ満点(Q=0.998)に達する一方、主張の希少性は人間の約5分の1にとどまり、品質と独自性の強い負相関(r=-0.67)が確認された。続編の Does AI Homogenize Student Thinking? (2026) は、6,875本のエッセイを5条件で比較し、AI支援は品質を大きく押し上げる(Cohen's d=3.7-4.8)と同時に、結合構造の分散の68-78%を奪うという「品質-均質化トレードオフ」を統計的に示した。さらに、均質化のパターンは生成モデル系列によって質的に異なり、単一モデルでの観察を一般化することは危険であるという、教育政策に直接届く知見が提示されている。本研究室は、AI時代のライティング評価が「うまく書けたか」ではなく「他者と違う考え方ができているか」を測る方向へ移行すべきだと主張している。

政治学 × AI

LLM が政治や安全保障に関する文書を生成・要約する時代に、モデル内部に潜む国家・政党への偏見をどう可視化するかは、民主主義基盤に関わる問いである。Affectosphere Group は、ウクライナ-ロシア戦争を題材に、社会観察・モデル診断・データ構築・政治理解の4系統で踏み込んだ。Multifaceted Exploration (2024) と Sentiment Analysis of Japanese Twitter Users (2024) では、20万件規模の日本語ツイートを BERT ベース8感情モデル(Plutchik 準拠)で分析し、領土問題や原発攻撃に対する強い悲しみ・恐怖・嫌悪と、ウクライナ支援を巡る喜び・期待が併存する「平和主義ベースの二相反応」を計量的に取り出した。次に Assessment of Conflict Structure Recognition (2024) は、国名を入れ替えたツイートに対する感情予測が一貫して反転するかを測る Emotion Inversion Consistency Rate (EICR) を導入し、日本語継続事前学習を行った LLM (Swallow 系) が、英語ベースの Llama2 よりも EICR が低下すること = ロシア・東欧側に強い負バイアスを持つことを実証した。続く Corpus Development (2024) では、人手依存だったデータ作成を LLM で半自動化する4フェーズパイプライン(生成→感情強度拡張→NSP妥当性検証→人手QA)を提案し、安全保障領域の標準コーパスとしての再利用可能性を担保した。Sentiment Bias and Security Analysis (2024) では分析対象を学習データ側に拡張し、C4・RedPajama・OSCAR・RefinedWeb の4大コーパスを VADER で走査して、Russia・Iran への有意な負感情と USA への過剰露出を定量化、バイアスの源流が学習データ段階に既に埋め込まれていることを示した。これら7論文は、社会観察・モデル診断・データ構築・源流追跡を一体として「LLM を安全保障や政治判断に持ち込む際に何を測れば不公平を検出できるか」という方法論的フレームを徐々に組み上げている。

生態学 × AI

生物分類学では、種の学名(属名+種小名)に形態・生息地・献名・文化などの命名背景が織り込まれており、その語源解析には専門家の長期にわたる文献調査が必要で、たとえばクモ48,000種の命名分類には2年を要した例がある。Evaluation of the Automated Labeling Method for Taxonomic Nomenclature (2025) は、JAFList クモデータセット(48,464種)を題材に、Role-Playing・Few-Shot・Chain-of-Thought を組み合わせたプロンプト最適化で LLM ベースの自動ラベリングを評価した。結果として、形態・地理・人名カテゴリでは人手アノテーションに近い高精度が達成された一方、生態・行動や近現代・文化では精度が大きく落ち込んだ。これは LLM が「直接的な文字列的手がかり」には強いが、行動学的・文化的解釈を要するカテゴリには弱いという、AI for Science 全体に通じる「ロングテール脆弱性」を生物学の文脈で具体的に示している。本研究室は、低リソース領域での LLM 活用に対し「どこまで任せ、どこから人間が引き取るか」の境界線を実証的に引く役割を果たしている。

法律学 × AI

法曹資格や宅地建物取引士(RETSE)のような国家資格試験は、専門知識と社会的責任を要する職務の門番として機能しており、AI がここに到達できるかは「AI による職務代替可能性」の試金石となる。Assessing GPTs Legal Knowledge in Japanese Real Estate Transactions Exam (2024) は、2016-2023年の10回分(各50問)の RETSE 過去問を GPT-3.5 と GPT-4 に解かせ、合格基準と比較した。結果、GPT-4 は GPT-3.5 を上回ったものの、いずれのモデルも合格水準には到達せず、特に税法・宅建業法など領域固有の細則を問う問題で誤答が集中した。一方、「慣習法を考慮せよ」といった補助プロンプトを与えると複雑な法的質問への正答率が改善し、AI が法律実務を完全代替する段階にはないが、学習者支援や法務補助ツールとしては有望であることが示された。Affectosphere Group は、こうした「合格と不合格のあいだ」を計量することで、AI 法務応用の社会実装ラインを実証的に提示している。

これら4領域(教育・政治・生態・法律)を横断して浮かび上がるのは、LLM が「平均的にもっともらしい出力」を高品質に生成する一方、希少な議論・少数派国家・ロングテール命名・領域固有細則といった「分布の端」を体系的に取り落とすという共通構造である。Affectosphere Group は、感情AI研究で培った「人間判断の揺らぎを情報として扱う」姿勢を持ち込むことで、これらの問題を単なる性能問題ではなく評価方法論そのものの問題として再定義している。AI for Science は本研究室にとって、感情AIで磨いた診断技法を社会的に意義ある問いに展開する場であると同時に、領域専門家とのコラボレーションから感情AIの方法論自体を鍛え直す場でもある。