总览
本章节范围:agent 怎么规划任务、怎么从错误中改进、怎么验证输出 目标读者:设计 agent 规划与自我纠错能力的工程师
范围与边界 (Scope)
- 包含:任务分解、反思与自修复、验证闭环
- 不包含:
- ReAct / ReWOO agent 循环机制 → 04-编排/02-单agent-loop
- evaluator-optimizer 等 workflow 编排模式 → 04-编排/05-确定性workflow
- SWE-bench 等评测基准本身 → 08-评测与可观测
名词定义
| 名词 | 定义 |
|---|---|
| 任务分解 | 把复杂任务拆成可执行子任务的策略 |
| least-to-most | 由易到难拆解子问题后顺序求解 |
| plan-and-solve | 先生成计划、再按计划执行的两阶段分解 |
| 动态重规划 | 按已完成子任务结果实时更新计划 |
| Self-Refine | 单模型生成-反馈-改进的自我精炼循环 |
| Reflexion | 把失败转语言反思存入记忆、跨 trial 积累 |
| self-evolve | agent 运行时自主修改自己的 scaffold 与工具 |
| 生成-验证非对称 | 验证候选解通常比生成正确解容易 |
| verifier-driven | 用可执行检查(测试/编译/PRM)做 ground truth 反馈 |
| LLM-as-judge | 用 LLM 评判输出质量,适合无可执行标准的开放任务 |
@tbl-agent-plan-glossary 规划与自纠章节核心名词定义:任务分解策略、反思机制与验证方法的术语说明
本章节所有文档默认这些名词已定义。
子文档索引 (Index)
- 02-任务分解 — least-to-most、plan-and-solve、树/图、动态重规划
- 03-反思与自修复 — Self-Refine、Reflexion、Self-Debugging、self-evolve
- 04-验证闭环 — verifier-driven、对抗投票、self-consistency、LLM-as-judge
阅读建议
三篇构成一条闭环:分解(02)→ 执行后验证(04)→ 据验证反思改进(03)。验证是反思的前提(生成-验证非对称),建议 04 在 03 之前读。
参考资料
- Reflexion / Self-Refine / Self-Consistency / LLM-as-Judge 等论文,详见各子文档
## 参考资料。