韬(τ)定律
华为提出以时间缩微替代几何制程缩微的后摩尔定律路径
核心要点:
- 用时间缩微 τ 替代几何缩微(制程微缩)
- 四层协同:器件 / 电路 / 芯片 / 系统
- 逻辑折叠:3D 堆叠缩短关键路径 >30%
- 不依赖先进制程,2031 目标等效 1.4nm
- 6 年已量产 381 款芯片
摩尔定律为什么走不动了?
摩尔定律的两大支柱在 2010 年代后相继动摇,几何微缩进入经济不可持续的拐点。 摩尔定律自 1965 年提出以来,以"每 18-24 个月晶体管数量翻倍"驱动了半导体产业近 60 年增长,但今天它面临物理和经济双重墙。
- 物理极限:制程微缩至 5nm 以下时,量子隧穿导致漏电流不可控,栅极对沟道的控制力下降,继续微缩的工程难度和成本呈指数增长。
- 经济瓶颈:登纳德缩放(Dennard Scaling, 1974)在 2006 年左右失效——晶体管缩小带来的功耗密度下降不再成立,功耗墙成为硬约束。先进制程晶圆成本从 28nm 的约 $5,000 飙升至 3nm 的 $18,000–20,000[1][2],晶体管成本红利消退。
华为于 2026-05-25 在上海 ISCAS 2026(IEEE 国际电路与系统研讨会)正式提出韬(τ)定律,试图开辟一条不依赖制程微缩的发展路径[3]。
韬定律改了什么衡量指标?
韬定律把衡量芯片进步的首要指标从"几纳米"换成"完成任务需要多少时间"。 何庭波在 keynote 中的技术表述是:以时间缩微(Time Scaling)替代几何缩微(Geometric Scaling),通过系统性降低时间常数 τ 来提升晶体管密度与系统性能[3]。
- 时间缩微:压缩各层级的 τ 值来提升性能,而非缩小晶体管的物理尺寸。
- 几何缩微:传统摩尔定律路径,靠光刻精度提升缩小栅极宽度、增加单位面积晶体管数量。
τ 是电子系统的特征时间常数,由电阻 R 和寄生电容 C 的 RC 乘积决定。 它跨越皮秒(器件级单管开关)到秒(系统级多节点任务响应)共 12 个数量级,构成一套全局时间度量衡。各层级 τ 不独立——下层 τ 的累积构成上层 τ 的基座,因此优化必须跨层协同。
芯片主频上限被工程关键路径的最长延迟锁定,压缩该路径的 τ 即可直接拉升时钟频率:
$$\begin{equation} f_{\text{max}} \propto \frac{1}{\tau_{\text{critical path}}} \label{eq:tao-fmax-critical-path} \end{equation}$$命名由来:τ (tau) 在电子工程中广泛表示时间常数。华为取 τ 的音译"韬",同时暗含"文韬武略"的战略谋划之意——一条绕开制程军备竞赛的迂回路径。
四层怎么协同压缩 τ?
韬定律不是单一技术突破,而是贯穿器件、电路、芯片、系统四个物理层级的协同优化方法。 每层有明确的时间尺度、核心策略和关键指标。
| 层级 | 时间尺度 | 核心策略 | 关键指标 |
|---|---|---|---|
| 器件层 | 皮秒 (ps) | 改良晶体管与互连结构的电阻及寄生电容,从物理源头压缩器件级 τ | 单管开关延迟 |
| 电路层 | 纳秒 (ns) | 逻辑折叠:3D 有源层堆叠替代 2D 平面布局,缩短关键路径走线 >30%,降低 RC 负载 | 关键路径延迟 |
| 芯片层 | 微秒 (μs) | 软件-架构-芯片全栈协同设计,按真实负载精细化调度指令与数据流 | 数据搬运延迟 |
| 系统层 | 秒 (s) | 灵衢总线统一内存编址 + Hi-ONE 近封装硅光 I/O,抹平服务器边界 | 跨节点延迟 <150ns |
@tbl-tao-four-layers 韬定律四层协同优化体系
电路层的核心手段是逻辑折叠。 逻辑折叠(Logic Folding) 指把传统 2D 平面的数字/模拟/存储电路拆分,通过原子级平整度的 Cu-Cu 混合键合(Hybrid Bonding,无微凸点的铜直连工艺,互连间距亚微米级) 垂直堆叠到多个有源层。效果是物理走线缩短 >30%,压制寄生阻容,从而拉升电路性能与晶体管密度。工程实现细节属于独立文档,此处只概括机制。
系统层的核心是灵衢总线。 灵衢总线(Unified Bus, UB) 是系统级互联协议,支持统一内存寻址与原生内存语义(load/store)访问,将跨节点延迟压缩至 150ns 以内。配合 Hi-ONE 近封装硅光 I/O,以光信号替代铜缆做机柜间互联,解决高带宽下的热耗散与信号衰减瓶颈[4]。灵衢的协议栈与硬件架构属于 docs/interconnect/ 的灵衢总线文档,本文不展开。
和摩尔定律、登纳德缩放差在哪?
三条路线的根本差异在优化维度:摩尔定律和登纳德缩放都"向内看"单个晶体管,韬定律"向上看"系统每一层挤时间。
| 维度 | 摩尔定律 | 登纳德缩放 | 韬定律 |
|---|---|---|---|
| 核心指标 | 晶体管数量/面积 | 功耗密度恒定 | 信号传播延迟 τ |
| 优化维度 | 空间(几何微缩) | 空间 + 电压 | 时间(延迟压缩) |
| 物理极限 | 量子隧穿 (∼1nm) | 阈值电压无法等比降(2006 失效) | 尚未触及理论极限 |
| 对制程的依赖 | 强(需更先进光刻) | 强 | 弱(主要靠架构创新) |
| 经济性 | 先进制程成本飙升 | 随摩尔退化 | 不依赖先进制程设备 |
| 适用范围 | 数字逻辑电路 | 数字逻辑电路 | 器件到数据中心全覆盖 |
@tbl-tao-comparison 韬定律、摩尔定律、登纳德缩放对比
韬定律不否认摩尔定律过去 60 年的成功,但指出那条路已走到经济不可持续的拐点,转而承认晶体管自身微缩已到瓶颈,从系统架构每一层"挤时间"。
路线图到哪一步了?
韬定律不是纯理论,过去 6 年已落地量产,但消费级旗舰验证要等 2026 秋季。 华为透露的三个时间节点:
- 2019–2025(6 年):基于韬定律方法论已设计并量产 381 款芯片,覆盖无线通信、AI 加速、车载等场景[3]。
- 2026 年秋季:发布全面应用逻辑折叠的新一代麒麟手机芯片,是逻辑折叠在消费级的首次完整落地。
- 2031 年:基于韬定律的高端芯片晶体管密度预计达到等效 1.4nm 制程水平。
何庭波论文进一步提出 2035 年展望——AI 硬件系统集成度实现 100 倍以上增长,但该数字属长期愿景,未披露具体技术路径[4]。
Takeaway
| 知识点 | 核心结论 |
|---|---|
| 核心替代 | 用时间缩微(压 τ)替代几何缩微(缩制程) |
| τ 是什么 | RC 决定的特征时间常数,跨皮秒到秒 12 个数量级 |
| 四层协同 | 器件/电路/芯片/系统逐层压 τ,下层累积成上层基座 |
| 逻辑折叠 | 电路层武器:3D 混合键合堆叠,走线缩短 >30% |
| 灵衢总线 | 系统层武器:统一内存编址,跨节点延迟 <150ns |
| 本质 | 架构创新替代制程军备竞赛,降低先进光刻依赖 |
| 落地状态 | 6 年量产 381 芯片;麒麟 2026 秋首发;2031 等效 1.4nm |
Limitations(本调研的局限)
- 数据局限:核心信息来自华为官方新闻稿和何庭波 ISCAS 2026 演讲的媒体报道。论文全文未公开,部分细节(τ 的精确数学表达、四层耦合模型)尚未经同行评议。
- 时间局限:韬定律 2026-05-25 首次公开,业界独立验证尚未充分展开。
- 验证局限:麒麟 2026 芯片尚未发布,逻辑折叠的实际性能提升和良率数据无第三方测试结果。
开放问题
- 韬定律是否经过半导体物理学界同行评议,还是仅停留在企业方法论层面?
- 逻辑折叠的混合键合良率在量产规模下能支撑多少层堆叠?
- 四层协同的跨层耦合模型是什么?器件级 τ 改善如何定量传导到系统级 τ?
- 韬定律对 AI 推理芯片(昇腾系列)的具体影响——麒麟是手机 SoC,AI 芯片的功耗墙和互联带宽需求完全不同?
- 灵衢总线 vs NVLink/CXL 的独立第三方延迟和带宽基准测试?
参考资料
- Tom's Hardware, TSMC's wafer pricing now $18,000 for a 3nm wafer, 2025-01. 3nm 晶圆 $18,000,对比 28nm ~$5,000。
- TechPowerUp, TSMC 3nm Wafer Pricing to Reach $20,000, 2022-11. 3nm 晶圆 $20,000 定价预测。
- 华为,华为发表韬(τ)定律,实现晶体管密度与系统性能突破, 2026-05-25. 韬定律定义、四层体系、381 芯片、麒麟 2026 秋季、2031 年 1.4nm。
- 21财经,看不懂华为"韬定律"?我们用大白话给何庭波论文做了全解读, 2026-05-26. 四层时间尺度、走线缩短 >30%、Hi-ONE 硅光 I/O、2035 年 100 倍集成度。
延伸阅读
- 观察者网/芯智观察所,华为提出的"韬定律"到底是什么?, 2026-05-25 — 逻辑折叠概念入门、与 Chiplet 的区分。
- Reuters, China's Huawei reveals chip design breakthrough amid US sanctions, 2026-05-25 — 制裁背景下的技术突围视角。
- IT之家,华为详解"逻辑折叠"等核心技术, 2026-05-25 — 逻辑折叠与四层体系的技术描述。