跳到主要内容
Tier6-Model
头脑风暴
COP
互联通信
问题追踪
通用知识库
其他
开发计划
refs
技术规格
验证
2 篇文档带有标签「verification」
查看所有标签
总览
本章节范围:agent 怎么规划任务、怎么从错误中改进、怎么验证输出
验证闭环
可执行验证、多数投票与 LLM-as-judge 三类信号各适合哪种场景,以及如何对冲 LLM 裁判的偏差