华为云 INSPIRE 2026
Agentic AI 四大基础设施新品发布事件快照与落地状态判读
核心要点:
- 四大 Agentic AI 基础设施新品:AICS 灵衢智算集群、AMS 记忆存储、CCE VolcanoNext 调度引擎、AgentSphere 运行环境
- AICS: 10 万卡 / 200 EFLOPS,底层灵衢 UB 协议,定位"Token 工厂"
- AMS: NPU 直通 CMS 硬件,PB 级记忆 + KV Cache 分层池化,首个基础设施层记忆产品
- 全部产品均为厂商规格、未出货、无第三方实测
本文定位:这篇是发布会"事件快照",不是技术原理深挖。AICS 底层灵衢协议的技术细节已有深度文档 1.15 灵衢总线 (UB),本文只做事件整理 + 产品参数 + 落地判读 + 交叉引用。AMS 的技术原理已注入 Agent 记忆系统 和 推理 KV 管理 对应章节。
这场大会发布了什么?
核心问题:华为云 INSPIRE 2026 的产品发布覆盖了 Agentic AI 基础设施的哪些层次?
华为云 CEO 周跃峰在 2026-06-05 上海西岸的 INSPIRE 创想者大会上发布了十余款新品,核心是四款 Agentic AI 基础设施产品,构成从算力到运行时的全栈 Agentic Infra[1]。
四大产品按基础设施栈自底向上:
| 产品 | 层次 | 一句话定位 |
|---|---|---|
| AICS 灵衢智算集群 | 算力层 | 极致效率的 Token 工厂 |
| CCE VolcanoNext | 调度层 | 通智一体化调度引擎 |
| AgentSphere | 运行时层 | 大规模智能体运行环境 |
| AMS 记忆存储 | 记忆层 | 打破 Agent 记忆瓶颈的 PB 级存储 |
@tbl-inspire-four-products 四大 Agentic AI 基础设施新品
此外还有 ModelArts Next(模型训推平台,含 RLaaS 强化学习服务、机密推理、模型路由)等 MaaS 层产品。战略口号是"打造智能时代的硅基黑土地"——把 Agentic AI 所需的基础设施做成可耕种的土壤,上层 Agent 应用在上面生长。
AICS 灵衢智算集群 — 能落地多少?
核心问题:AICS 的关键参数是什么,哪些已有出货验证、哪些是路线图?
AICS 是华为云在灵衢 UB 协议 + Atlas 950 超节点基础上打包的云上算力产品。 灵衢协议的协议栈、MemFabric 统一编址、LQC 缓存一致性、UB Switch 拓扑等深度技术内容见 1.15 灵衢总线 (UB),本文只列 AICS 的产品级参数:
| 维度 | 参数 | 可信度 |
|---|---|---|
| 集群规模 | 10 万卡级 | 厂商规格 |
| 总算力 | 200 EFLOPS(精度未明确,按 Atlas 950 的 8 EFLOPS FP8 × ~25 超节点推算) | 厂商规格 |
| Token 生成时延 | < 10 ms | 厂商规格 |
| 千卡吞吐 | 500 万 Tokens/s | 厂商规格 |
| 在线可用性 | 95%(中文源)/ 99.95%(英文源,疑为同一数字的不同表述) | 厂商规格 |
| 底层互联 | 灵衢 UnifiedBus(UB 2.0 声明 2.1 μs 跨机柜延迟;UB 1.0 已出货于 Atlas 900 A3,300+ 套部署) | 灵衢 1.0 已出货 |
| 超节点单元 | Atlas 950(8,192 NPU / 8 EFLOPS FP8 / 16 PB/s),2025-09 发布,Q4 2026 计划交付 | 厂商规格,未出货 |
@tbl-inspire-aics AICS 产品参数与落地状态
关键判断:AICS 的算力数字(200 EFLOPS)约等于 25 个 Atlas 950 超节点通过 UBoE Scale-Out 组网。Atlas 950 计划 Q4 2026 交付,AICS 作为其上层的云产品尚无出货时间表。10 万卡跨超节点时的通信效率、故障恢复、有效 MFU 均无第三方数据。灵衢 UB 1.0 已有 300+ 套 Atlas 900 A3 部署验证[2],UB 2.0 规范已公开但尚未大规模出货。
AMS Agentic 记忆存储 — 和现有记忆系统差在哪?
核心问题:AMS 在现有生产记忆系统(Mem0/Letta/A-Mem/Hindsight)中处于什么位置?
AMS 是第一个把 Agent 记忆做成 IaaS 层产品的方案。 现有四套生产记忆系统(Mem0、MemGPT/Letta、A-Mem、Hindsight)都在软件/框架层解决问题——它们假设下面有存储,自己不碰硬件。AMS 下沉到 NPU 直通 CMS(Context Memory Storage)专用硬件,在基础设施层提供 PB 级记忆空间 + KV Cache 分层池化。
核心参数:
| 维度 | 参数 | 可信度 |
|---|---|---|
| 硬件架构 | NPU 直通 CMS,数据不经过 CPU 中转 | 厂商规格 |
| 存储容量 | PB 级记忆空间 | 厂商规格 |
| KV Cache 管理 | 分层池化(hot/warm/cold 分级),降低推理成本 | 厂商规格 |
| 记忆持久化 | 天级(支持 multi-day long-running tasks) | 厂商规格 |
| 落地状态 | 厂商发布,未出货,无实测 | — |
@tbl-inspire-ams AMS 核心参数
AMS 的详细技术分析已注入两处知识文档:
- 作为第 5 套记忆系统对标:3.7 生产记忆系统对标 — AMS 的独特定位是"基础设施层记忆",四套现有系统都在软件层
- KV Cache 硬件 offload 路径:3.7 推理侧 — KV 管理 — NPU→CMS 直通区别于传统的 CPU/NVMe offload
AMS 的真正增量不在准确率或检索机制,而在硬件路径。 传统 KV offload 走 NPU→CPU→NVMe,多次 PCIe 中转;AMS 的 NPU→CMS 直通路跳过了 CPU 这一跳。这对 Tier6 的 memory 分析模块有潜在对照价值——如果 CMS 硬件带宽/延迟数字公开,可以作为推理内存模型的新的 offload 路径参数。
CCE VolcanoNext 和 AgentSphere — 调度和运行时
核心问题:这两款产品在 Agentic Infra 栈中填了什么空位?
CCE VolcanoNext 是通智一体化调度引擎,统一调度通用计算(传统微服务/大数据)和智能计算(模型推理/训练/Agent 任务)。Volcano 是云原生批量调度项目(CNCF Sandbox),VolcanoNext 在其上增加了 Agent 任务感知—— Agent 的长任务、突发调用、跨会话状态保持等特征需要不同于批处理 Job 的调度策略。
AgentSphere 是大规模智能体运行环境,提供 Agent 的托管执行、状态管理、多 Agent 协同等能力。细节在新闻稿中着墨最少,暂无可展开的技术参数。
两款产品的落地状态均为厂商发布,未出货。
落地状态总结
截至 2026-06-09,INSPIRE 发布的四款核心产品无一出货、无第三方实测。 唯一有出货验证的是底层灵衢协议(Atlas 900 A3 超节点 300+ 套部署,已出货),但那是 HC 2025 的产物,不是 INSPIRE 的新东西。
| 产品 | 落地状态 | 数据可信度 |
|---|---|---|
| AICS 灵衢智算集群 | 厂商发布,未出货 | 厂商规格 |
| AMS 记忆存储 | 厂商发布,未出货 | 厂商规格 |
| CCE VolcanoNext | 厂商发布,未出货 | 厂商规格 |
| AgentSphere | 厂商发布,未出货 | 厂商规格 |
| 灵衢 UB 协议(底层) | UB 1.0 已出货(300+ 套 Atlas 900 A3);UB 2.0 规范已公开,AICS/Atlas 950 将基于 UB 2.0 | 中(UB 1.0 有部署但无独立基准测试) |
@tbl-inspire-landing INSPIRE 2026 产品落地状态
Takeaway
| 知识点 | 核心结论 |
|---|---|
| 大会性质 | 华为云 Agentic AI 基础设施全线产品发布,不是技术深讲 |
| AICS | 200 EFLOPS / 10 万卡,底层灵衢已有深度文档,AICS 作为云产品未出货 |
| AMS | 首个 IaaS 层记忆产品,NPU 直通 CMS + PB 级 + KV 分层池化,技术细节已注入记忆系统和 KV 管理文档 |
| CCE VolcanoNext | 通智一体化调度,Agent 任务感知 |
| AgentSphere | 大规模智能体运行环境,细节最少 |
| 落地状态 | 四款产品全部未出货、无实测;底层灵衢协议已有出货验证 |
| 与 Tier6 关联 | AICS 互联参数可对照灵衢文档作为建模输入;AMS 的 KV offload 路径可作为 memory 分析模块参考 |
参考资料
- 华为云,华为云发布Agentic AI系列新品打造智能时代"硅基黑土地",2026-06-05. https://www.huaweicloud.com/news/2026/20260605100619686.html
- 华为,以开创的超节点互联技术,引领AI基础设施新范式,HC 2025-09-18. https://www.huawei.com/cn/news/2025/9/hc-xu-keynote-speech
延伸阅读
- 1.15 灵衢总线 (UB) — 灵衢 UB 协议栈、MemFabric、LQC、UB Switch 深度调研
- 1.2 韬(τ)定律 — 韬定律系统层的灵衢总线概述
- 3.7 生产记忆系统对标 — AMS 作为第 5 套记忆系统对标
- 3.7 推理侧 — KV 管理 — KV offload 技术全景(含 AMS NPU→CMS 路径)