总览

本章节范围：LLM agent 的记忆系统——跨上下文窗口的信息存储、检索与遗忘 目标读者：设计 agent harness、需要让 agent 跨会话保持状态的工程师

范围与边界 (Scope)

包含：记忆分类体系、上下文压缩 (compaction)、文件型外置记忆、向量检索记忆、记忆操作生命周期、生产记忆系统对标、记忆安全
不包含：
- 单次窗口内的上下文组织（prompt 结构、token 经济学） → 02-上下文工程
- 通用 prompt injection 与沙箱 → 07-安全与沙箱

上下文工程 vs 记忆系统的划界：02-上下文工程 管单次窗口内放什么、怎么组织；本章管跨窗口怎么存、怎么取、怎么遗忘。compaction 处在交界，划归本章（它本质是把历史转成可持久记忆）。

名词定义

名词	定义
工作记忆 (working memory)	当前上下文窗口内激活的信息，生命周期等于一个决策周期
情节记忆 (episodic)	来自过往决策周期的具体经验：事件历史、轨迹
语义记忆 (semantic)	去语境化的抽象知识：世界知识、自身知识
程序性记忆 (procedural)	"怎么做"的知识，含模型参数隐式部分与代码/skills 显式部分
compaction （上下文压缩）	历史被模型压成摘要、同一 agent 以摘要为起点续跑；有损
context-reset	终止当前会话，用结构化 handoff 文档启动新 agent 续跑
context anxiety	模型临近它认为的上下文上限时过早结束任务的行为
handoff （交接文档）	记录状态、决策、未完成任务的文件，桥接跨会话 agent
write/select/compress/isolate	上下文操作四原语：外存写入 / 检索回取 / 压缩 / 隔离
文件型外置记忆	用文件系统（CLAUDE.md/MEMORY.md 等）存记忆，可检视、可 git
多信号检索 (multi-signal)	语义 + 关键词 (BM25) + 实体并行打分后融合的检索
ANN 索引	近似最近邻索引 (Flat/IVF/HNSW/PQ)，在召回率/延迟/内存间权衡
两阶段检索	bi-encoder 粗召回 + cross-encoder 精排的检索漏斗
RRF	Reciprocal Rank Fusion，按排名融合多路检索结果
ADD/UPDATE/DELETE/NOOP	记忆写入时 LLM 对新事实判定的四种操作
LongMemEval / LoCoMo	长期对话记忆评测基准，测信息抽取/时序推理等能力
记忆投毒 (memory poisoning)	在写入阶段注入恶意内容污染 agent 持久记忆
记忆主权 (mnemonic sovereignty)	对记忆"何可写、谁可读、何时改、哪可忘、哪可审计"的可验证治理能力

@tbl-agent-memory-glossary 记忆系统核心名词定义：工作记忆、情节记忆、语义记忆、程序性记忆等术语释义

本章节所有文档默认这些名词已定义，概念型文档只在正文首现处补充本文新引入的概念。

子文档索引 (Index)

02-记忆分类体系 — 表示 / 时间 / 内容 / 控制四个正交分类维度
03-compaction-与上下文压缩 — 三策略、触发机制与 context anxiety
04-文件型外置记忆 — 为什么用文件系统而非向量库，CLAUDE.md 分层与 handoff
05-向量检索记忆 — kNN-LM、Memorizing Transformer、embedding vs BM25、chunk 策略
06-记忆操作生命周期 — 构建/更新/查询三阶段、四原语、遗忘机制
07-生产记忆系统对标 — Mem0 / A-Mem / MemGPT / Hindsight 横评
08-记忆安全 — 投毒、跨会话污染、检索注入与治理原语
09-架构选型与决策 — 从任务特征到记忆栈：决策树 + archetype 落点 + 反模式自检

阅读建议

建立框架 → 先读 02-记忆分类体系和 06-记忆操作生命周期，拿到分类坐标与操作骨架。
工程落地 → 03-compaction 和 04-文件型外置记忆是生产 coding agent 的两条主路径。
选型与扩展 → 05-向量检索记忆打底层，07-生产记忆系统对标给系统横评，09-架构选型与决策给可执行的选型流程。
风险评估 → 08-记忆安全。

参考资料

Tang et al. LLM Agent Memory: A Survey from a Unified Representation-Management Perspective. Preprints.org 202603.0359, 2026.
Sumers et al. Cognitive Architectures for Language Agents (CoALA). arXiv:2309.02427, 2023.
Anthropic. Effective context engineering for AI agents / Harness design for long-running application development. 2025.
Liu et al. Dive into Claude Code: The Design Space.... arXiv:2604.14228, 2026.
各子文档 ## 参考资料 段含完整引用。

范围与边界 (Scope)​

名词定义​

子文档索引 (Index)​

阅读建议​

参考资料​

范围与边界 (Scope)

名词定义

子文档索引 (Index)

阅读建议

参考资料