Column
全員が AI で「うまく書ける」時代、組織はどこで個性を測るのか
AI 補助で誰もが上手な文章を量産できる時代。便利さの裏で、組織全体の思考がじわじわ均質化していく ── 議論の希少性を測る最新研究と、感情 AI の視点から 5 分で。
こんにちは。Affectosphere Group の井下です。
最近、企業の HR 担当の方からこんな相談を受けました。
「うちの会社の小論文選考、AI で書いたっぽい応募が増えてて。文章はうまいんですけど、なんか全員、似たようなこと書いてくるんですよね」
これ、聞いた瞬間にちょっと立ち止まりました。
「うまい文章」が選考の差別化情報だった時代は、たしかにあった。でも今は、ChatGPT や Claude を使えば、誰でも一定水準以上の文章が出てきます。読みやすい、構成がきれい、誤字がない ── そこに到達するのは、もう個人の能力差ではなくなった。
ということは、これまで「文章のうまさ」を見て採用・評価していた組織は、何を見ているつもりで何も見ていないことになる ── という、ぞわっとする話でもあります。
私たちが 2026 年に出した 2 本の研究 1 2 は、この問題を技術的に正面から扱いました。一方は「議論の希少性」を測る枠組み、もう一方は「AI 補助が学生の思考をどれくらい均質化させるか」の大規模実験です。
今日はそこから見えた話を、HR・教育・採用に関わる方向けに書きます。
今日の結論を 3 行で
- 価値: AI 補助で全員が一定水準の文章を書けるのは、業務全体の生産性にとっては明確にプラス。
- 落とし穴: ただし「うまい文章」が評価軸として死につつある。組織は別の軸を持たないと、誰が独自に考えているか分からなくなる。
- 隠れた代償: 全員が同じツールに頼ると、組織の思考自体が静かに均質化する。これは数字に出ないが、中長期で確実に効いてくる。
順に書きます。
① 価値の話 ── AI が「下手な文章を撲滅した」のはすごい
最初に、価値側をちゃんと言っておきたい。
新人が書く提案書、初稿レベルの社内文書、海外向けメールの英訳 ── これまで「読みづらい文章を読まされる側」が払っていた時間コストは、本当に大きかったはずです。
AI 補助によって、その下限が一気に底上げされた。これは率直にすごい。
私たちの研究でも、AI 補助つきで書かれた文章は、文章品質の評価では人間の上位層に匹敵する水準に達することが確認されています。誰でも、初稿でそこに行ける。これだけで全社員の作業時間が何時間も浮く会社は、たぶん多い。
なので「AI を使わせるな」みたいな話ではないんです、今日は。
問題は、便利さに引きずられて「うまい文章 = 良い思考」と無意識に等式を組んでしまうこと。ここから先が、ちょっと厄介な話になります。
② 研究が見せた、もう一つの顔
うちの研究で印象的だったのは、こういう結果でした。
人間が書いたエッセイ 1,375 本と、AI 生成エッセイ 1,000 本を比較したら、文章品質の評価では AI が人間の上位層と同等。
なのに、主張の希少性 ── 「他の人が出さない論点を立てているか」── は、人間の約 5 分の 1 にとどまった。
つまり ──「うまく書く能力」と「他者と違う論点を立てる能力」は、別の能力だった。これまで一つの指標で代用できていたのが、AI によって分離されてしまった、と言ったほうが正確かもしれません。
もう 1 本の研究では、6,875 本のエッセイを「完全人間執筆」から「AI 単独生成」まで 5 段階で比較しました。
結果は、AI 補助が強くなるほど文章品質はきれいに上がる一方で、議論の結合構造 ── どの主張をどの証拠とどう繋ぐかのパターン ── の分散は 68〜78% 減少。
論文ではこれを「品質-均質化トレードオフ」と呼んでいます。
ビジネスの言葉に翻訳すると、こうです。
AI 補助で、全員が「平均より上手な文章」を書ける。 同時に、組織全体としては「似たような考え方しかしなくなる」リスクが、定量的に確認された。
短期 KPI は上がる。けれど長期の意思決定品質は、じわっと下がる。
③ 感情 AI の視点から見ると、何が見える?
ここが、Affectosphere Group として強調したいポイントです。
私たちの研究室は、感情を「曖昧で多義的なまま扱う」ことを核にしています。理由はシンプルで、人の気持ちや意見は、平均値や多数決で潰せるものじゃないからです。
それと同じ構造が、思考の均質化にも見えるんですよね。
採用試験で全員が AI で書いた小論文を提出してくる。文章はみんな上手い。でもその中で「他の人と違う違和感を抱えていて、変な角度から論点を立ててくる人」が、文章品質では見えなくなってしまう。
これは、感情ラベル付けで「多数派の感情だけ拾って、少数派の判断を切り捨てるとどうなるか」という話と、構造がそっくりです。
つまり ──
「精度」「効率」「品質」だけで評価していると、最も評価したかった少数派の独自性が、評価器の解像度の下に沈んでしまう。
これは AI ツールの問題ではなく、評価器を設計し直さない組織側の問題、というのが、感情 AI を研究してきた立場からの率直な見立てです。
じゃあ、明日から何をするか
リスクだけ煽るのはフェアじゃないので、現場で動かせる話を 3 つだけ。
- 設問を作り直す: 「うまく書けば点が入る問い」を、「他の応募者が出さない論点・反例・経験を出した人が点を取る問い」に書き換える。これだけで AI 丸投げ組と独自思考組の差が見え始めます。
- 育成プログラムに「AI を使わない時間」を意図的に作る: 論点出しと仮説構築の初期フェーズは AI なし。AI は「磨き」のフェーズで使う。これは個人の独自思考の筋肉を残すために、わりと効きます。
- 社内文書の議論パターンを、ときどき棚卸す: 全員が同じ AI ツールを使い始めると、提案書も会議資料も収束していく。四半期に一度でいいので「最近の社内文書、議論の幅がどれくらいあるか」をレビューする習慣をつける。
ちなみに、研修事業者・HR テックの方には別の機会も見えています。AROA のような希少性スコアリングを商品化できれば、AI 補助時代の新しい評価基盤になりえます。
締め
「うまく書ける」を測ってきた評価器は、AI によって役目を半分くらい終えたと思っています。
これは悲しい話ではなく、むしろ「組織が本当に欲しかったものは何だったか」を問い直すチャンスです。
文章品質はあくまで代理指標で、私たちが本当に欲しかったのは「独自に考えられる人」だったはず。今、その本丸を直接測る技術が、研究室レベルで揃いつつあります。
感情 AI が「平均値で潰されない人の気持ち」を扱おうとしているのと同じように、思考の評価も「平均値で潰されない独自性」を測るほうに向かうべきだと思っています。
ということで、今日はここまで。
「うちの選考、文章のうまさで通したつもりが、AI のうまさで通してたかも」と気になった方、ぜひ一度、評価ルーブリックを開き直してみてください。
参考論文
- Keito Inoshita, Michiaki Omura, Tsukasa Yamanaka, Go Maeda, Kentaro Tsuji (2026). Argument Rarity-based Originality Assessment for AI-Assisted Writing. arXiv preprint.
- Keito Inoshita, Michiaki Omura, Tsukasa Yamanaka, Go Maeda, Kentaro Tsuji (2026). Does AI Homogenize Student Thinking? A Multi-Dimensional Analysis of Structural Convergence in AI-Augmented Essays. arXiv preprint.
※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。
Footnotes
-
Keito Inoshita, Michiaki Omura, Tsukasa Yamanaka, Go Maeda, Kentaro Tsuji, “Argument Rarity-based Originality Assessment for AI-Assisted Writing”, arXiv preprint, 2026. ↩
-
Keito Inoshita, Michiaki Omura, Tsukasa Yamanaka, Go Maeda, Kentaro Tsuji, “Does AI Homogenize Student Thinking? A Multi-Dimensional Analysis of Structural Convergence in AI-Augmented Essays”, arXiv preprint, 2026. ↩