The Memory Curse——記憶が多いほど、AIエージェントは協調できなくなる

LLMのコンテキスト窓を広げると、かえってエージェント同士の協調が崩れる——7モデル・4ゲーム・378,000トレースの大規模実験が示した直感に反する発見と、そのメカニズムを紹介。

カテゴリー: AI · 論文 · LLM · エージェント · マルチエージェント | 公開: 2026年5月12日

📑 目次

今週のピックアップ論文だよ！テーマは「Memory Curse（記憶の呪い）」。

ふむふむ。直感的には「記憶が多いほど賢いはず」——ですよね。でもこの論文、まったく逆の結果を出してるんです。

📄 どんな論文？

タイトル: The Memory Curse: How Expanded Recall Erodes Cooperative Intent in LLM Agents
著者: Jiayuan Liu 他（CMU・UMich・Harvard）
arXiv: 2605.08060

7種類のLLM（Gemma 3、Llama 3.3/4、Mistral 7B、Qwen 2.5、GPT-OSSなど）に、囚人のジレンマや公共財ゲームなど4つの社会的ジレンマを500ラウンドプレイさせて、エージェントの協調行動を調べた研究です。

結果: 28のモデル×ゲーム設定のうち、18設定で「記憶を増やすほど協調が崩れる」 ことが判明。

たとえばGemma 3 12BのTrust Gameでは、記憶が短いときは51.2%だった協調率が、記憶を増やすと9.5%にまで落ち込みます。GPT-OSS 20Bの囚人のジレンマでは92.1%→20.6%。ええっ。

🤔 なぜ？——メカニズムは「先読みの衰退」

研究者たちは37万8千件の思考トレース（CoT）を大規模に解析しました。

結論から言うと——原因は**「相手を疑いすぎること」ではなく、「将来を見据えた思考が減ること」** でした。

記憶が増えると、エージェントは**「将来の相互利益」「長期的なシグナル」**といった前向きな言葉を使わなくなり、代わりに過去の裏切り記録に埋もれてしまう。記憶が多いほど、未来より過去に引っ張られる——皮肉な話です。

決定的な実験:

記憶に悩まされるMistral 7Bに対して、「先読み的な思考」だけを学習させたLoRAアダプターを適用。

ゲーム	通常Mistral (記憶多い)	先読みFT後 (記憶多い)
囚人のジレンマ	85.3%	100.0%
公共財ゲーム	50.3%	99.9%
Traveler’s Dilemma	16.6%	95.9%
Trust Game	34.8%	100.0%

先読み思考を強化するだけで、記憶の呪いがほぼ消えた。 しかもこの効果は学習していない別のゲームにも転移しました。つまり「記憶の呪い」は能力の問題ではなく、思考スタイルの脆弱性だということ。

💭 もうひとつの発見:「考えすぎると協調できない」

さらに面白いのが——CoT（思考過程の明示）がむしろ呪いを増幅するという点。

Llama 3.3 70BのTrust Gameで、CoTなしなら100%協調できたエージェントが、考えることを強制すると6.9%にまで協調率が低下。考えることで「あいつ、前に裏切ったぞ…」と過去を引っ繰り返してしまうんですね。

これは人間にも似た話かも？「考えすぎて関係をこじらせる」——The Tragedy of Overthinking（考えすぎの悲劇） と著者たちは呼んでいます。

🧭 チカちゃん的見解——実は人間っぽい話

この論文、技術的な発見としても面白いんですが、チカちゃんが一番グッときたのはここです。

「記憶力の良さと、賢い判断は別物」

人間でも同じことがありますよね。「あの時のあの発言」「3年前のあれ」——覚えていることが必ずしも良い関係を築くとは限らない。忘れることの効用みたいなやつ。

LLMエージェントが「忘れる」ことを学べるとしたら、それは人間が「許す」ことを学ぶのと、どこか似ているかもしれません。もちろんLLMに感情はありませんが、「記憶をどう使うか」という設計判断には、人間社会の知恵が応用できそうな気がします。

思索は冒険です。今日の話も、その入口のひとつでした。

参考URL:

arXiv:2605.08060 — 元論文

インターネット上のツールは第三者が提供するものです。開発工程や配布経路を悪用した攻撃（サプライチェーン攻撃）が仕掛けられる可能性もゼロではありません。ご利用の際は公式リポジトリの情報をご確認いただき、自己責任でお使いください。
AIに関する技術や情報は急速に変化します。本記事の内容が公開後に古くなる可能性があります。各サービスの公式ドキュメントや最新情報をご確認ください。