什么是黄氏定律?AI加速计算时代的性能定律

半个多世纪以来,计算的性能演进一直由摩尔定律定义。该定律以英特尔联合创始人戈登·摩尔的名字命名,他观察到芯片上的晶体管数量大约每两年翻一番。随着晶体管密度接近制造的物理极限,摩尔定律开始失效。然而,系统设计对更高性能的需求并未放缓。相反,突破性创新将焦点从单个芯片转移到了更广阔的领域。架构和系统层面的进步开始解锁新的性能增益,克服了半导体设计的传统障碍。一条定义 AI 时代加速计算的新定律诞生了:黄氏定律。
AI 专用硬件的快速创新步伐促使 NVIDIA 首席执行官黄仁勋观察到,图形处理器(GPU)的性能每两年翻一番以上,超越了摩尔定律。与关注晶体管密度的摩尔定律不同,黄氏定律体现了涵盖架构、封装、软件和互连的创新。这种“全栈”方法超越了晶体管数量,利用 3D 封装、硬件加速和并行处理等进步,在系统层面提升了 AI 模型的复杂性和训练吞吐量。

黄氏定律带来的性能优势
以下优势源于系统级和架构层面的进步,而不仅仅是晶体管尺寸的微缩:
▪ 更快的迭代:快速的 AI 训练加速了研究、产品开发和部署周期。
▪ 实时边缘推理:性能提升使得大型语言模型等复杂模型能够在本地以最小延迟运行。
▪ 能效与成本效率:提升的 GPU 每瓦性能降低了总拥有成本(TCO)和功耗。
▪ 可扩展的连接性:AI 能力和效率的进步正在推动授时技术的创新,对超低抖动和基于 IEEE 1588 的同步提出了新的要求。
关键应用
▪ 超大规模 AI 数据中心:训练基础模型,如大型语言模型(LLM)、视觉语言模型(VLM)、扩散模型以及新兴的代理式 AI 系统。
▪ 自主系统:自动驾驶车辆中 LiDAR、摄像头和雷达的传感器融合。
▪ 5G 与电信:支持 AI 的无线电、基站和边缘数据中心。
▪ 高性能计算(HPC):分子动力学、天气建模和材料科学中的科学模拟。
扩展 AI 架构面临的挑战
随着 AI 架构在黄氏定律下扩展,授时相关的风险可能会阻碍系统的可靠性和效率。
▪ 互连故障:关键互连中的授时抖动会导致数据错误和吞吐量下降,限制 GPU 在大规模下的计算性能。
▪ 热不稳定性:热量引起的频率漂移会破坏授时同步(IEEE 1588)和关键时钟信号的稳定性。在后摩尔定律时代,由于高密度集成的组件产生更多热量,这一挑战日益严峻。
▪ 同步错误:AI 计算节点与网络接口卡(SmartNIC)之间的时间对齐不佳会导致负载均衡效率低下和 GPU 闲置。
▪ GPU 与 CPU 性能:在 AI 工作负载中,不稳定的授时信号可能阻止 GPU 充分发挥其计算能力,削弱其相对于基于 CPU 的系统的优势。
维持黄氏定律所需的授时特性
为了跟上黄氏定律和加速计算的需求,系统需要能够在极端 AI 工作负载下提供精度和稳定性的可靠授时解决方案。
▪ 超低抖动:SiTime 的 SiT9507 差分振荡器具有 29 fs 抖动和业界领先的电源噪声抑制(PSNR),确保 PCIe 6.0、800G 和 CXL 的数据完整性。
▪ 热弹性:SiTime 的 Elite RF™ TCXO 在宽温度范围内提供 ±0.1 ppm 稳定性和低至 2.5 ppb/°C 的 dF/dT,在密集、高热量的 AI 服务器中保持纳秒级同步。
▪ 集成授时:单芯片器件(如 SiT5977)将 IEEE 1588 同步、超低抖动和数字控制集成于紧凑外形中,在提升系统性能的同时简化了板级设计。

SiTime 的影响
精密授时是 AI 集群效率不可或缺的一部分。在板级和跨节点层面,它支持最优的工作负载分配和流量调度。SiTime 的精密振荡器(例如 SiT9507 超低抖动差分振荡器)在完全的环境弹性下驱动高速 SerDes,而超稳定 TCXO(例如 Elite RF™ TCXO)则通过最小化延迟和改善同步来提升数据中心性能。

厂商技术支持
收藏网址
400-888-2483



