跳到主要内容

总览

本章节范围:LLM agent 的记忆系统——跨上下文窗口的信息存储、检索与遗忘 目标读者:设计 agent harness、需要让 agent 跨会话保持状态的工程师

范围与边界 (Scope)

  • 包含:记忆分类体系、上下文压缩 (compaction)、文件型外置记忆、向量检索记忆、记忆操作生命周期、生产记忆系统对标、记忆安全
  • 不包含:

上下文工程 vs 记忆系统的划界02-上下文工程 管单次窗口内放什么、怎么组织;本章管跨窗口怎么存、怎么取、怎么遗忘。compaction 处在交界,划归本章 (它本质是把历史转成可持久记忆)。

名词定义

名词定义
工作记忆 (working memory)当前上下文窗口内激活的信息,生命周期等于一个决策周期
情节记忆 (episodic)来自过往决策周期的具体经验:事件历史、轨迹
语义记忆 (semantic)去语境化的抽象知识:世界知识、自身知识
程序性记忆 (procedural)"怎么做"的知识,含模型参数隐式部分与代码/skills 显式部分
compaction (上下文压缩)历史被模型压成摘要、同一 agent 以摘要为起点续跑;有损
context-reset终止当前会话,用结构化 handoff 文档启动新 agent 续跑
context anxiety模型临近它认为的上下文上限时过早结束任务的行为
handoff (交接文档)记录状态、决策、未完成任务的文件,桥接跨会话 agent
write/select/compress/isolate上下文操作四原语:外存写入 / 检索回取 / 压缩 / 隔离
文件型外置记忆用文件系统 (CLAUDE.md/MEMORY.md 等) 存记忆,可检视、可 git
多信号检索 (multi-signal)语义 + 关键词 (BM25) + 实体并行打分后融合的检索
ANN 索引近似最近邻索引 (Flat/IVF/HNSW/PQ),在召回率/延迟/内存间权衡
两阶段检索bi-encoder 粗召回 + cross-encoder 精排的检索漏斗
RRFReciprocal Rank Fusion,按排名融合多路检索结果
ADD/UPDATE/DELETE/NOOP记忆写入时 LLM 对新事实判定的四种操作
LongMemEval / LoCoMo长期对话记忆评测基准,测信息抽取/时序推理等能力
记忆投毒 (memory poisoning)在写入阶段注入恶意内容污染 agent 持久记忆
记忆主权 (mnemonic sovereignty)对记忆"何可写、谁可读、何时改、哪可忘、哪可审计"的可验证治理能力

@tbl-agent-memory-glossary 记忆系统核心名词定义:工作记忆、情节记忆、语义记忆、程序性记忆等术语释义

本章节所有文档默认这些名词已定义,概念型文档只在正文首现处补充本文新引入的概念。

子文档索引 (Index)

阅读建议

参考资料

  • Tang et al. LLM Agent Memory: A Survey from a Unified Representation-Management Perspective. Preprints.org 202603.0359, 2026.
  • Sumers et al. Cognitive Architectures for Language Agents (CoALA). arXiv:2309.02427, 2023.
  • Anthropic. Effective context engineering for AI agents / Harness design for long-running application development. 2025.
  • Liu et al. Dive into Claude Code: The Design Space.... arXiv:2604.14228, 2026.
  • 各子文档 ## 参考资料 段含完整引用。