Column
「毎回同じことを説明する」をなくす ── 金融 AI が文脈を自動継続する設計
金融 LLM エージェントに「複雑さをユーザーに転嫁しない」知識ハーネスを組み込む InKH が、タスク品質 0.815・遅延 900ms・古い知識使用を 96% 削減した。顧客文脈を自動継続する CX を実現する設計原則を読み解く。
こんにちは。Affectosphere Group の井下です。
金融アドバイザーとの相談を経験したことがある方なら、こんな場面に覚えがあるかもしれません。
「前回もお伝えしましたが、私の状況は…」と、毎回ゼロから説明し直す。
担当者が変わるたびに、前の相談内容が引き継がれておらず、また一から話す。AI チャットでも同様です。新しいセッションを開くと、前回話した内容は一切残っていない。「あなたとは初めてお話しします」という状態からスタートする。
これは「複雑さをユーザーに転嫁している」設計です。本来、システム側が引き受けるべき記憶コストを、ユーザーが毎回負担している。
2026 年 6 月に arXiv で公開された研究(Ailiya Borjigin, Igor Stadnyk, Ben Bilski ら、arXiv:2606.01886)は、金融 LLM エージェントのためのインタラクション・ネイティブ型知識ハーネス「InKH」を提案します。ユーザーが毎回コンテキストを再提供しなければならない問題を、システム側の設計で解決する試みです。
今日の 3 点
- 価値: 文脈をシステムが自動継続することで、「毎回ゼロから説明する」CX コストをなくせる。
- 仕組み: 受動的知識注入と時間軸グラフメモリを組み合わせた低遅延アーキテクチャ。
- 金融・保険・証券系への応用: 顧客継続率と業務効率の両立を設計で実現するヒント。
① 「複雑さの転嫁」という問題
AI アシスタントの普及で、金融サービスにも AI チャットボットが増えました。ただ、多くの場合、これらのシステムには構造的な問題があります。
毎回のセッションが独立しています。前回の会話、顧客の資産状況、過去の相談履歴、ポートフォリオの変化 ── これらを次のセッションに引き継ぐ仕組みがない。あっても、ユーザーが「前回の話なのですが…」と補足しなければ動き出せない。
これは技術的な問題である以前に、設計思想の問題です。複雑さをどちらが引き受けるか、という問い。
InKH(Interaction-Native Knowledge Harness)が目指すのは、「システム側が複雑さを吸収する」アーキテクチャです。
② InKH の 2 つの仕組み
InKH は 2 つのメカニズムを組み合わせています。
受動的知識注入(Passive Knowledge Injection)
ユーザーとのやり取りを通じて、「作業コンテキストバッファ」が自動構築されます。ユーザーが明示的に「覚えておいてください」と言わなくても、会話の中で言及された情報がバックグラウンドで整理・保存されていく。
ポイントは「受動的」という言葉です。ユーザーが情報を登録するアクションを取る必要がない。使っているだけで文脈が蓄積される。
時間軸グラフメモリ(Temporal Graph Memory)
保存された情報を「時間の流れ」とともにグラフ構造で管理します。「3 ヶ月前に話した内容」「先週の相談で更新された情報」「最新のポートフォリオ状況」が時系列で整理され、必要なときに低遅延で参照できる。
論文によれば、古い知識の使用率を 96.58% 削減し、平均タスク品質 0.815、遅延 900ms を達成したとのことです。
この 900ms という数字は実用に耐えうる水準です。金融アドバイスのような複雑な文脈参照を伴う処理でありながら、1 秒以下で応答できる。
③ 金融・保険・証券業への応用
この仕組みを実際のビジネスに当てはめると、どういうサービスが設計できるでしょうか。
顧客 AI アシスタントへの適用:「前回の続き」がデフォルトになる
資産運用系のアプリ、保険相談チャット、証券会社のサポート窓口に InKH 型アーキテクチャを組み込むと、顧客が「前回話した内容」を再入力する必要がなくなります。
「以前ご相談いただいた内容を踏まえると」から始まる応答が、自動で生成される。顧客から見ると、「自分のことを理解しているアドバイザー」の感覚を持てる。
CX の向上が契約継続率にどう影響するか、という KPI が設定できます。解約率・利用頻度・NPS スコアを InKH 導入前後で比較することで、設計変更の価値を数値化できます。
アドバイザー支援ツールへの適用:引き継ぎコストを削減する
担当アドバイザーが変更になったとき、新しい担当者が「前回の担当者が把握していた文脈」を即座に参照できる仕組みとして使えます。
顧客の「話した履歴」「意思決定の経緯」「直近の懸念事項」がグラフメモリに蓄積されていれば、新担当者は初回面談からゼロスタートにならない。顧客体験の断絶を減らせる。
引き継ぎ業務の工数削減と顧客満足度の維持を同時に達成できる設計です。
コンプライアンス・監査への応用
時間軸グラフメモリは、「いつどんな情報をもとにアドバイスしたか」の記録としても機能します。金融サービスにはコンプライアンス上の説明責任が求められます。この仕組みは業務効率化だけでなく、説明可能性(Explainability)の確保にも使えます。
「この時点でこの情報を参照してこのアドバイスをした」というトレーサビリティが、システムに組み込まれる。
設計原則として汎用性がある
この研究が提示する「複雑さをユーザーではなくシステムが吸収する」という原則は、金融に限らない普遍的な設計思想です。
医療の診療記録管理、法律相談のケース管理、HR の面談履歴管理 ── 「文脈を毎回ユーザーが再提供している」場所には、どこでもこの原則が使えます。
ただし、すべてのユーザー情報をシステムが自動で蓄積・参照するということは、データプライバシーとセキュリティの問題と常にセットです。金融データや個人の相談履歴を扱う場合、どの情報を保持し、どう管理し、いつ削除するかの設計が、機能設計と同等の重要性を持ちます。
「便利さ」と「信頼」を同時に設計することが、この種のシステムには求められます。
では!
参考論文
- Ailiya Borjigin, Igor Stadnyk, Ben Bilski, Maksym Chikita, Dmytro Kyrylenko, Sofiia Pidturkina, Julia Stadnyk (2026). Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents. arXiv preprint.
※ 本記事は一部 AI により執筆されており、間違った情報が含まれる恐れがあります。