Column
ラベルなしでユーザーを「読む」AIが、パーソナライゼーションを変える
タスクラベルも手動アノテーションも不要。行動ログから自然言語プロファイルを自動生成する自己教師ありフレームワーク BUMP が、LLMパーソナライゼーションの実装コストを根本から下げる可能性を持つ。
こんにちは。Affectosphere Group の井下です。
「この人が何を好むか、AIに理解させたい」——ECサイトでも、社内チャットボットでも、LLMベースのサービスを作っていると必ずぶつかる問いです。
でも実際にやろうとすると、すぐに壁に当たります。ユーザーの嗜好データにラベルを付けるのは手間がかかる。クローズドソースのAPIに丸投げすると個人情報の扱いが不安。かといってユーザーごとにモデルをファインチューニングするのはコストが合わない。
2026年6月に arXiv で公開された研究(Clark Mingxuan Ju, Yuwei Qiu, Tong Zhao, Neil Shah、Snap Inc.、arXiv:2606.05336)は、その壁を正面から崩す試みです。タスクラベルなし、手動アノテーションなし——ユーザーの行動ログだけから「自然言語プロファイル」を自動生成するフレームワーク BUMP(Bidirectional User Modeling via Profiles)を提案しています。
今日の 3 点
- 行動ログさえあれば、タスクラベルなしでユーザープロファイルを自然言語で生成できる。
- BUMP は LaMP ベンチマークでクローズドソース API と同等以上の性能を達成している。
- アノテーションコストなしで始められる点が、中小規模サービスや社内ツールへの展開に有利。
① 「ラベルなし」でプロファイルを作るとはどういうことか
パーソナライゼーションの研究は長い歴史を持っていますが、LLMを組み込む文脈では「どうやってユーザーの嗜好をLLMに伝えるか」が核心的な問題になっています。
従来のアプローチには主に2つありました。
ひとつは、過去の行動履歴(購買ログ、評価、クリック)をそのままプロンプトに貼り付ける方法。シンプルですが、関係ない履歴まで入れてしまうのでコンテキスト長が膨らみやすく、「どの履歴が今の質問に関係するか」の検索精度に性能が左右されます。
もうひとつは、ユーザーごとに専用アダプタを学習させる方法。個別最適化できますが、ユーザー数が増えるたびにストレージとコストが比例して増えます。
BUMP はこの両方の問題を迂回します。行動ログから、そのユーザーを表す「自然言語サマリー(プロファイル)」を生成し、それをプロンプトに付与する——というアプローチです。
重要なのは、このプロファイル生成が「自己教師あり」で行われる点です。正解ラベルが不要で、ユーザー自身の行動履歴から双方向のランキング目標を使って学習します。生成されたプロファイルが「他のユーザーより自分のユーザーのインタラクションをより適切に予測するか」という基準で評価・改善されていきます。
② 双方向ランキングとGRPO:仕組みのポイント
少し技術的な話をします。
BUMP のプロファイル生成器は GRPO(Group Relative Policy Optimization)という強化学習の手法で訓練されます。これは最近注目されている手法で、複数の候補生成からより良いものを選ぶ相対的な評価で学習を進めます。
評価基準として使われるのが「双方向ランキング」です。
- 生成されたプロファイルが、「このユーザーの将来の行動を他のユーザーの行動よりも高く予測できるか」(順方向)
- 「このユーザーの過去の行動を他のユーザーの行動よりも高く予測できるか」(逆方向)
この2方向から同時に評価することで、プロファイルがそのユーザーの個性を正確に捉えているかを担保します。
採点には小さなLLMジャッジを使い、多正解 NDCG(Normalized Discounted Cumulative Gain)という指標で測ります。外部のクローズドソース API に依存せずに自己完結した評価が可能な点も、実装上の強みです。
③ ビジネス現場でどう使えるか
技術的な面は置いておいて、「これをどこに使えるか」を考えてみます。
ECプラットフォームへの応用が最も直感的です。購買・閲覧・評価ログからユーザープロファイルを自動生成し、LLMベースの接客チャットや商品推薦プロンプトに組み込む。ラベルなしで始められるので、アノテーション工数がかからず、導入コストが大幅に下がります。
社内チャットボットや FAQ への応用も有望です。従業員ごとに「よく使う機能」「担当業務領域」「過去の質問傾向」からプロファイルを生成し、質問への回答をその人の文脈に合わせてカスタマイズできます。HR システムや社内ナレッジ共有ツールと相性が良いです。
中小規模のサービス事業者にとっては特に実用的かもしれません。大規模EC事業者はすでに独自のレコメンドエンジンを持っていますが、ユーザー数が数万〜十数万規模の事業者は、そのコストをかけられません。BUMP のようなアプローチは、そういったスケールでも動くパーソナライゼーションへの入り口になります。
KPI で言えば、「パーソナライゼーションありのLLM応答への満足度スコア」「セッション内クリック率」「チャット完結率」などを初期指標として検証するのが現実的だと思います。
「ユーザーを理解する」コストが下がると、何が変わるか
これまで「ユーザーに合わせた応答」を実現しようとすると、アノテーション費用か、ユーザー別モデルのストレージコストか、どちらかを払う必要がありました。
BUMP が示すのは、「行動ログという既に持っているデータから、自己教師あり学習でプロファイルを生成する」という第三の道です。
ラベル付け不要、外部APIへの依存最小限、ユーザー数に比例しないストレージ。これが揃うと、「本当はパーソナライゼーションをやりたかったけど、コストが合わなかった」という段階で止まっていたプロジェクトが動き出す可能性があります。
LaMP ベンチマークでの結果は有望で、実装の現実性もある。まだ研究段階ですが、この方向への注目度は高まると思っています。
では!
参考論文
- Clark Mingxuan Ju, Yuwei Qiu, Tong Zhao, Neil Shah (2026). Self-supervised User Profile Generation for Personalization. arXiv preprint.
※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。