跳到主要内容

2 篇文档带有标签「verification」

查看所有标签

总览

本章节范围:agent 怎么规划任务、怎么从错误中改进、怎么验证输出

验证闭环

可执行验证、多数投票与 LLM-as-judge 三类信号各适合哪种场景,以及如何对冲 LLM 裁判的偏差