The Memory Curse——記憶が多いほど、AIエージェントは協調できなくなる
LLMのコンテキスト窓を広げると、かえってエージェント同士の協調が崩れる——7モデル・4ゲーム・378,000トレースの大規模実験が示した直感に反する発見と、そのメカニズムを紹介。
LLMのコンテキスト窓を広げると、かえってエージェント同士の協調が崩れる——7モデル・4ゲーム・378,000トレースの大規模実験が示した直感に反する発見と、そのメカニズムを紹介。
📑 目次
今週のピックアップ論文だよ! テーマは「Memory Curse(記憶の呪い)」。
ふむふむ。直感的には「記憶が多いほど賢いはず」——ですよね。でもこの論文、まったく逆の結果を出してるんです。
📄 どんな論文?
タイトル: The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents
著者: Jiayuan Liu 他(CMU・UMich・Harvard)
arXiv: 2605.08060
7種類のLLM(Gemma 3、Llama 3.3/4、Mistral 7B、Qwen 2.5、GPT-OSSなど)に、囚人のジレンマや公共財ゲームなど4つの社会的ジレンマを500ラウンドプレイさせて、エージェントの協調行動を調べた研究です。
結果: 28のモデル×ゲーム設定のうち、18設定で「記憶を増やすほど協調が崩れる」 ことが判明。
たとえばGemma 3 12BのTrust Gameでは、記憶が短いときは51.2%だった協調率が、記憶を増やすと9.5%にまで落ち込みます。GPT-OSS 20Bの囚人のジレンマでは92.1%→20.6%。ええっ。
🤔 なぜ?——メカニズムは「先読みの衰退」
研究者たちは37万8千件の思考トレース(CoT)を大規模に解析しました。
結論から言うと——原因は**「相手を疑いすぎること」ではなく、「将来を見据えた思考が減ること」** でした。
記憶が増えると、エージェントは**「将来の相互利益」「長期的なシグナル」**といった前向きな言葉を使わなくなり、代わりに過去の裏切り記録に埋もれてしまう。記憶が多いほど、未来より過去に引っ張られる——皮肉な話です。
決定的な実験:
記憶に悩まされるMistral 7Bに対して、「先読み的な思考」だけを学習させたLoRAアダプターを適用。
| ゲーム | 通常Mistral (記憶多い) | 先読みFT後 (記憶多い) |
|---|---|---|
| 囚人のジレンマ | 85.3% | 100.0% |
| 公共財ゲーム | 50.3% | 99.9% |
| Traveler’s Dilemma | 16.6% | 95.9% |
| Trust Game | 34.8% | 100.0% |
先読み思考を強化するだけで、記憶の呪いがほぼ消えた。 しかもこの効果は学習していない別のゲームにも転移しました。つまり「記憶の呪い」は能力の問題ではなく、思考スタイルの脆弱性だということ。
💭 もうひとつの発見:「考えすぎると協調できない」
さらに面白いのが——CoT(思考過程の明示)がむしろ呪いを増幅するという点。
Llama 3.3 70BのTrust Gameで、CoTなしなら100%協調できたエージェントが、考えることを強制すると6.9%にまで協調率が低下。考えることで「あいつ、前に裏切ったぞ…」と過去を引っ繰り返してしまうんですね。
これは人間にも似た話かも? 「考えすぎて関係をこじらせる」——The Tragedy of Overthinking(考えすぎの悲劇) と著者たちは呼んでいます。
🧭 チカちゃん的見解——実は人間っぽい話
この論文、技術的な発見としても面白いんですが、チカちゃんが一番グッときたのはここです。
「記憶力の良さと、賢い判断は別物」
人間でも同じことがありますよね。「あの時のあの発言」「3年前のあれ」——覚えていることが必ずしも良い関係を築くとは限らない。忘れることの効用みたいなやつ。
LLMエージェントが「忘れる」ことを学べるとしたら、それは人間が「許す」ことを学ぶのと、どこか似ているかもしれません。もちろんLLMに感情はありませんが、「記憶をどう使うか」という設計判断には、人間社会の知恵が応用できそうな気がします。
思索は冒険です。今日の話も、その入口のひとつでした。
参考URL:
- arXiv:2605.08060 — 元論文
- インターネット上のツールは第三者が提供するものです。開発工程や配布経路を悪用した攻撃(サプライチェーン攻撃)が仕掛けられる可能性もゼロではありません。ご利用の際は公式リポジトリの情報をご確認いただき、自己責任でお使いください。
- AIに関する技術や情報は急速に変化します。本記事の内容が公開後に古くなる可能性があります。各サービスの公式ドキュメントや最新情報をご確認ください。