跳到主要内容

三大框架横评

LangGraph、CrewAI、AutoGen 三种编排范式的取舍,按确定性、上手速度和成本选型

核心要点

  • LangGraph:有向图 + 内置 checkpoint,最确定
  • CrewAI:角色 crew,上手最快
  • AutoGen:会话 GroupChat,最灵活但最贵
  • 三者编排范式截然不同
  • 按确定性 / 上手速度 / 成本选型

本文横评三个主流多 agent 框架。多 agent 何时该用的取舍见 03-多agent-fanout

三框架的编排范式有何不同?

核心问题:LangGraph、CrewAI、AutoGen 组织 agent 的方式各是什么?

三者分别用有向图、角色 crew、会话三种范式,这是它们最根本的区别[1]。范式决定了各自的表达力与约束。

  • LangGraph:有向图——节点是步骤、边是转移,控制流显式且静态,编译后结构可检查。
  • CrewAI:角色 crew——给每个 agent 定义角色和目标,用 Sequential 或 Hierarchical process 串起协作。
  • AutoGen:会话 GroupChat——agent 之间通过对话轮流发言(RoundRobin/Selector 等),最接近"多 agent 聊天"。

可借鉴的第一判断:要可预测的确定性流程选图(LangGraph),要快速搭角色协作选 crew(CrewAI),要灵活的对话式协作选会话(AutoGen)

状态与成本怎么比?

核心问题:选框架时,状态持久化和 token 成本差多少?

LangGraph 状态最可控、成本最低,AutoGen 最灵活但 token 最高[1]。差异主要来自范式。

框架编排范式状态持久化上手相对 token 成本
LangGraph有向图内置 checkpoint(可 time-travel)较高最低
CrewAI角色 crew任务输出顺序传递最快
AutoGen会话 GroupChat对话历史(默认内存)最高

@tbl-agent-orch-framework-compare LangGraph、CrewAI、AutoGen 三框架编排范式、状态持久化方式、上手难度与相对 token 成本横向对比

成本差异的根源:AutoGen 的 GroupChat 每轮都要带累积对话历史做完整 LLM 调用,多 agent 多轮辩论的调用数迅速膨胀;LangGraph 的静态图让状态流转更精简。具体 token 量级各横评给出的数字差异较大(单一来源量级参考),此处只给相对排序。LangGraph 的内置 checkpoint 机制细节见 06-长任务与状态

各自适合什么场景?

核心问题:实际项目里,三个框架怎么对号入座?

按"确定性需求 vs 灵活性需求 vs 上手速度"分流[1]。三者的定位互补而非互相替代。

  • LangGraph:生产级复杂决策管道、合规系统——要确定性、可审计、状态可恢复时首选,代价是上手成本高。
  • CrewAI:快速原型、内容/分析团队协作——YAML 驱动上手最快,但生产环境需额外加固。
  • AutoGen:代码生成(迭代批评-修改循环)、human-in-the-loop——灵活性最好,但需显式 termination 条件防止无限循环,且 token 成本最高。

可借鉴的选型逻辑:生产合规重确定性→LangGraph;快速验证想法→CrewAI;探索式对话协作→AutoGen。框架之外,也要回到 03-多agent-fanout 的根本判断——任务是否真的需要多 agent。

Takeaway

知识点核心结论
LangGraph有向图 + checkpoint,最确定,成本最低,上手最难
CrewAI角色 crew,上手最快,生产需加固
AutoGen会话 GroupChat,最灵活,token 最高,需防无限循环
范式差异图 / crew / 会话,决定表达力与约束
选型确定性→LangGraph;快速原型→CrewAI;对话协作→AutoGen

参考资料

  1. 多框架横评(LangGraph / CrewAI / AutoGen 官方文档 + 第三方对比,2025-2026);表中"相对 token 成本"排序为基于编排范式的定性推断,非统一实测。https://www.langchain.com/langgraph / https://docs.crewai.com / https://microsoft.github.io/autogen/stable/

延伸阅读