Column
AIエージェントが87%の時間を返してくれる——でも、それだけじゃない
自律型AIエージェントは工数を87%削減し、コストを94%削ることが本番データで示された。しかし最も重要な発見は「効率化の先に何が起きるか」にある。
こんにちは。Affectosphere Group の井下です。
「AIで業務を効率化する」という話はもう耳慣れていると思います。でも「効率化したあと、人は何をするようになるのか」は、あまり語られていないですよね。
今日紹介する研究は、その「その後」を本番データで初めて明らかにしたものです。
2026年6月に arXiv で公開された研究(Jeremy Yang, Kate Zyskowski, Noah Yonack, Jerry Ma、arXiv:2606.07489)は、Perplexity の実際のプロダクト利用データを使って、自律型AIエージェント(Perplexity Computer)と従来の検索型AI(Perplexity Search)を比較しました。PoC の話ではなく、実際のユーザーが日常的に使っているプロダクトのログを分析した研究です。
今日の 3 点
- 自律型AIエージェントは同一タスクで作業時間を87%・コストを94%削減した。
- エージェントはユーザーの不満率を55%削減し、クオリティ面でも優位性を示した。
- エージェント導入後、ユーザーはより複雑な横断的業務に挑戦するようになる「スコープ拡張効果」が確認された。
① 87%削減・94%削減という数字の意味
まず数字を整理します。
Perplexity Search(従来の検索型AI)と Perplexity Computer(自律型エージェント)を同一のタスクで比較したとき、次の差が出ました。
- 作業完了時間:269分 → 36分(87%削減)
- コスト:94%削減
- ユーザーの不満率:Computerは Searchより55%低い
タスクあたりの自律作業時間も大きく異なります。Searchがユーザーセッションあたり平均33秒しか稼働しないのに対し、Computerは26分間にわたって自律的に動きます。その間、ユーザーは待つだけでよい。
「26分間の自律作業」というのは、エージェントが単に検索して結果を返すのではなく、タスクを細かく分解し、複数のステップを順番に実行し、中間の結果を検証しながら進めることを意味します。
これが87%の時間削減につながっています。
DX推進の文脈でよく出てくる「工数削減何%」という話は、たいてい試算や限定的な実験の話です。この研究は本番のプロダクトデータで87%という数字を示している点で、実務的な説得力が高いです。
② なぜ不満率まで下がるのか
効率化と品質向上が同時に起きているのが、この研究の興味深い点です。
通常、「速く・安く」を追求すると品質が落ちる、というトレードオフが生じます。でもこの研究では、ユーザーの不満率がSearchより55%低いという結果が出ています。
その理由として研究は「タスク分解と実行の自動化」を挙げています。検索型AIはユーザーが一つ一つ検索クエリを発行して、結果を自分で統合する必要があります。対して自律型エージェントはその作業を内部で完結させ、ユーザーには統合済みの結果を渡します。
ユーザーが「途中で何度もやり直す」「部分的な結果を自分でつなぎ合わせる」というコストが消えることで、満足度が上がる、という構造です。
この視点はビジネス実装にとって重要です。「時間短縮」だけを KPI に置くと、品質やユーザー体験への影響を見落としがちです。でもこのデータは「時間・コスト・満足度」が三つ同時に改善することを示しています。
③ 「スコープ拡張効果」——最も重要な発見
ここが今日の記事で一番伝えたいポイントです。
エージェントを導入したあと、ユーザーの行動は単純化しませんでした。逆に、より複雑なことに挑戦するようになりました。
研究では、Computerを使うようになったユーザーのクエリが「より多くの職業領域にまたがる複合タスク形式」になっていく傾向を確認しています。これを研究は「スコープ拡張効果」として論じています。
直感的に言うと、「AIが日常のルーティン作業を引き受けてくれるようになった分、人間はこれまで手が回らなかった複雑な問いに時間を使えるようになった」という現象です。
例えば、競合調査・市場分析・顧客データの統合分析といった、本来は複数の担当者や数日かけてやるような業務が、エージェントによってセッション内で完結するようになる。そしてその体験を得たユーザーは、次に「もっと複雑な業務もやってみよう」と思うようになる。
これは「AI導入 = 人員削減」という単純な話ではありません。「AI導入 = ナレッジワーカーが扱える業務の質的な拡張」という話です。
現場でどう試すか:ユースケース・部署・KPI
この研究の知見を自社に持ち帰るとしたら、どこから始めるとよいでしょうか。
まず「反復的な情報収集・統合業務」を特定することから始めることをおすすめします。具体的には以下のような業務が候補になります。
- 経営企画:市場調査レポートの作成、競合動向のまとめ、決算資料の要点抽出
- DX推進:社内ナレッジの横断検索、ベンダー比較レポートの作成
- 人事・採用:候補者リサーチ、業界給与水準の調査・整理
- オペレーション管理:複数拠点のデータ収集・集計・レポート化
これらは今まで「担当者が複数ソースを自力でたたき回して時間を使う」業務です。自律型エージェントが代替しやすい領域です。
KPI として追うべきは次の3つだと思います。
- 作業完了時間の変化(Before/After で計測できる)
- 担当者の「その他業務への着手率」の変化(スコープ拡張効果の確認)
- タスク品質の評価(ユーザー満足度やレビュー通過率)
特に2つ目の「スコープ拡張効果の確認」が重要です。工数削減だけを見ていると、本当の価値を見逃します。「これまで着手できていなかった複合タスクに、チームが時間を使えるようになったか」を見ることが、AIエージェント導入の成否を判断する正しい問いだと思います。
「手が回らなかった業務」への投資
AIエージェント導入の最大の価値は、工数削減ではないかもしれません。
「これまでやりたかったけど、時間がなくてできていなかった横断的な業務に、チームが本格的に取り組めるようになる」という変化こそが、長期的には最も大きなインパクトをもたらす可能性があります。
この研究はその仮説を、本番のプロダクトデータで初めて裏付けたものです。PoC を設計するときは「何を削減するか」だけでなく、「削減した時間で何に挑戦するか」を最初から設計に含めることを強くおすすめします。
では!
参考論文
- Jeremy Yang, Kate Zyskowski, Noah Yonack, Jerry Ma (2026). How AI Agents Reshape Knowledge Work: Autonomy, Efficiency, and Scope. arXiv preprint.
※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。