跳到主要内容

华为云 INSPIRE 2026

Agentic AI 四大基础设施新品发布事件快照与落地状态判读

核心要点

  • 四大 Agentic AI 基础设施新品:AICS 灵衢智算集群、AMS 记忆存储、CCE VolcanoNext 调度引擎、AgentSphere 运行环境
  • AICS: 10 万卡 / 200 EFLOPS,底层灵衢 UB 协议,定位"Token 工厂"
  • AMS: NPU 直通 CMS 硬件,PB 级记忆 + KV Cache 分层池化,首个基础设施层记忆产品
  • 全部产品均为厂商规格、未出货、无第三方实测

本文定位:这篇是发布会"事件快照",不是技术原理深挖。AICS 底层灵衢协议的技术细节已有深度文档 1.15 灵衢总线 (UB),本文只做事件整理 + 产品参数 + 落地判读 + 交叉引用。AMS 的技术原理已注入 Agent 记忆系统推理 KV 管理 对应章节。

这场大会发布了什么?

核心问题:华为云 INSPIRE 2026 的产品发布覆盖了 Agentic AI 基础设施的哪些层次?

华为云 CEO 周跃峰在 2026-06-05 上海西岸的 INSPIRE 创想者大会上发布了十余款新品,核心是四款 Agentic AI 基础设施产品,构成从算力到运行时的全栈 Agentic Infra[1]

四大产品按基础设施栈自底向上:

产品层次一句话定位
AICS 灵衢智算集群算力层极致效率的 Token 工厂
CCE VolcanoNext调度层通智一体化调度引擎
AgentSphere运行时层大规模智能体运行环境
AMS 记忆存储记忆层打破 Agent 记忆瓶颈的 PB 级存储

@tbl-inspire-four-products 四大 Agentic AI 基础设施新品

此外还有 ModelArts Next(模型训推平台,含 RLaaS 强化学习服务、机密推理、模型路由)等 MaaS 层产品。战略口号是"打造智能时代的硅基黑土地"——把 Agentic AI 所需的基础设施做成可耕种的土壤,上层 Agent 应用在上面生长。

AICS 灵衢智算集群 — 能落地多少?

核心问题:AICS 的关键参数是什么,哪些已有出货验证、哪些是路线图?

AICS 是华为云在灵衢 UB 协议 + Atlas 950 超节点基础上打包的云上算力产品。 灵衢协议的协议栈、MemFabric 统一编址、LQC 缓存一致性、UB Switch 拓扑等深度技术内容见 1.15 灵衢总线 (UB),本文只列 AICS 的产品级参数:

维度参数可信度
集群规模10 万卡级厂商规格
总算力200 EFLOPS(精度未明确,按 Atlas 950 的 8 EFLOPS FP8 × ~25 超节点推算)厂商规格
Token 生成时延< 10 ms厂商规格
千卡吞吐500 万 Tokens/s厂商规格
在线可用性95%(中文源)/ 99.95%(英文源,疑为同一数字的不同表述)厂商规格
底层互联灵衢 UnifiedBus(UB 2.0 声明 2.1 μs 跨机柜延迟;UB 1.0 已出货于 Atlas 900 A3,300+ 套部署)灵衢 1.0 已出货
超节点单元Atlas 950(8,192 NPU / 8 EFLOPS FP8 / 16 PB/s),2025-09 发布,Q4 2026 计划交付厂商规格,未出货

@tbl-inspire-aics AICS 产品参数与落地状态

关键判断:AICS 的算力数字(200 EFLOPS)约等于 25 个 Atlas 950 超节点通过 UBoE Scale-Out 组网。Atlas 950 计划 Q4 2026 交付,AICS 作为其上层的云产品尚无出货时间表。10 万卡跨超节点时的通信效率、故障恢复、有效 MFU 均无第三方数据。灵衢 UB 1.0 已有 300+ 套 Atlas 900 A3 部署验证[2],UB 2.0 规范已公开但尚未大规模出货。

AMS Agentic 记忆存储 — 和现有记忆系统差在哪?

核心问题:AMS 在现有生产记忆系统(Mem0/Letta/A-Mem/Hindsight)中处于什么位置?

AMS 是第一个把 Agent 记忆做成 IaaS 层产品的方案。 现有四套生产记忆系统(Mem0、MemGPT/Letta、A-Mem、Hindsight)都在软件/框架层解决问题——它们假设下面有存储,自己不碰硬件。AMS 下沉到 NPU 直通 CMS(Context Memory Storage)专用硬件,在基础设施层提供 PB 级记忆空间 + KV Cache 分层池化。

核心参数:

维度参数可信度
硬件架构NPU 直通 CMS,数据不经过 CPU 中转厂商规格
存储容量PB 级记忆空间厂商规格
KV Cache 管理分层池化(hot/warm/cold 分级),降低推理成本厂商规格
记忆持久化天级(支持 multi-day long-running tasks)厂商规格
落地状态厂商发布,未出货,无实测

@tbl-inspire-ams AMS 核心参数

AMS 的详细技术分析已注入两处知识文档:

AMS 的真正增量不在准确率或检索机制,而在硬件路径。 传统 KV offload 走 NPU→CPU→NVMe,多次 PCIe 中转;AMS 的 NPU→CMS 直通路跳过了 CPU 这一跳。这对 Tier6 的 memory 分析模块有潜在对照价值——如果 CMS 硬件带宽/延迟数字公开,可以作为推理内存模型的新的 offload 路径参数。

CCE VolcanoNext 和 AgentSphere — 调度和运行时

核心问题:这两款产品在 Agentic Infra 栈中填了什么空位?

CCE VolcanoNext 是通智一体化调度引擎,统一调度通用计算(传统微服务/大数据)和智能计算(模型推理/训练/Agent 任务)。Volcano 是云原生批量调度项目(CNCF Sandbox),VolcanoNext 在其上增加了 Agent 任务感知—— Agent 的长任务、突发调用、跨会话状态保持等特征需要不同于批处理 Job 的调度策略。

AgentSphere 是大规模智能体运行环境,提供 Agent 的托管执行、状态管理、多 Agent 协同等能力。细节在新闻稿中着墨最少,暂无可展开的技术参数。

两款产品的落地状态均为厂商发布,未出货。

落地状态总结

截至 2026-06-09,INSPIRE 发布的四款核心产品无一出货、无第三方实测。 唯一有出货验证的是底层灵衢协议(Atlas 900 A3 超节点 300+ 套部署,已出货),但那是 HC 2025 的产物,不是 INSPIRE 的新东西。

产品落地状态数据可信度
AICS 灵衢智算集群厂商发布,未出货厂商规格
AMS 记忆存储厂商发布,未出货厂商规格
CCE VolcanoNext厂商发布,未出货厂商规格
AgentSphere厂商发布,未出货厂商规格
灵衢 UB 协议(底层)UB 1.0 已出货(300+ 套 Atlas 900 A3);UB 2.0 规范已公开,AICS/Atlas 950 将基于 UB 2.0中(UB 1.0 有部署但无独立基准测试)

@tbl-inspire-landing INSPIRE 2026 产品落地状态

Takeaway

知识点核心结论
大会性质华为云 Agentic AI 基础设施全线产品发布,不是技术深讲
AICS200 EFLOPS / 10 万卡,底层灵衢已有深度文档,AICS 作为云产品未出货
AMS首个 IaaS 层记忆产品,NPU 直通 CMS + PB 级 + KV 分层池化,技术细节已注入记忆系统和 KV 管理文档
CCE VolcanoNext通智一体化调度,Agent 任务感知
AgentSphere大规模智能体运行环境,细节最少
落地状态四款产品全部未出货、无实测;底层灵衢协议已有出货验证
与 Tier6 关联AICS 互联参数可对照灵衢文档作为建模输入;AMS 的 KV offload 路径可作为 memory 分析模块参考

参考资料

  1. 华为云,华为云发布Agentic AI系列新品打造智能时代"硅基黑土地",2026-06-05. https://www.huaweicloud.com/news/2026/20260605100619686.html
  2. 华为,以开创的超节点互联技术,引领AI基础设施新范式,HC 2025-09-18. https://www.huawei.com/cn/news/2025/9/hc-xu-keynote-speech

延伸阅读