跳到主要内容

总览

本章节范围:agent 怎么规划任务、怎么从错误中改进、怎么验证输出 目标读者:设计 agent 规划与自我纠错能力的工程师

范围与边界 (Scope)

名词定义

名词定义
任务分解把复杂任务拆成可执行子任务的策略
least-to-most由易到难拆解子问题后顺序求解
plan-and-solve先生成计划、再按计划执行的两阶段分解
动态重规划按已完成子任务结果实时更新计划
Self-Refine单模型生成-反馈-改进的自我精炼循环
Reflexion把失败转语言反思存入记忆、跨 trial 积累
self-evolveagent 运行时自主修改自己的 scaffold 与工具
生成-验证非对称验证候选解通常比生成正确解容易
verifier-driven用可执行检查(测试/编译/PRM)做 ground truth 反馈
LLM-as-judge用 LLM 评判输出质量,适合无可执行标准的开放任务

@tbl-agent-plan-glossary 规划与自纠章节核心名词定义:任务分解策略、反思机制与验证方法的术语说明

本章节所有文档默认这些名词已定义。

子文档索引 (Index)

阅读建议

三篇构成一条闭环:分解(02)→ 执行后验证(04)→ 据验证反思改进(03)。验证是反思的前提(生成-验证非对称),建议 04 在 03 之前读。

参考资料

  • Reflexion / Self-Refine / Self-Consistency / LLM-as-Judge 等论文,详见各子文档 ## 参考资料