华为发布全球最强AI算力集群!Atlas超节点全面超越英伟达,2026年量产

单芯片受限却实现集群级超越,华为用系统架构创新打破AI算力壁垒

在2025年华为全联接大会上,AI芯片再次成为绝对主角。华为轮值董事长徐直军带来了令人震撼的AI算力新品——全球最强算力超节点和集群Atlas 950 SuperPoD和Atlas 960 SuperPoD,分别支持8192张和15488张昇腾卡,标志着华为在AI算力竞赛中实现了从追随者到引领者的角色转变。

超节点技术:用系统架构创新弥补制程短板

华为轮值董事长徐直军坦承,由于制程和流片方面的限制,”短期在单芯片性能上和英伟达有差距”。然而,华为通过极致的系统架构和互联技术创新,将大量芯片整合成”超级计算机”,在集群级别实现了全面超越。

这种超节点技术将大量计算单元通过高速互联技术整合成一台逻辑上统一的、能像单台计算机一样学习、思考和推理的巨型AI计算机。它正成为AI基础设施建设的新范式,展现了华为”以系统创新弥补单点不足”的技术路线。

昇腾芯片路线图:一年一代,算力翻倍

华为公布了清晰的昇腾芯片演进规划,坚持”一年一代,算力翻倍”的节奏,持续演进数据格式和带宽技术,以满足AI算力增长的无限需求。

​昇腾950系列​​:

  • ​950PR​​:2026年Q1上市,面向推荐和偏好场景的推理优化芯片,采用华为自研HBM内存方案
  • ​950DT​​:2026年Q4上市,面向训练和深度学习场景,内存容量高达144GB,访问带宽达4TB/s

​昇腾960系列​​:2027年Q4上市,旗舰训练芯片,各项规格相比昇腾950实现翻倍提升,支持华为自研的Hi-F4数据格式

​昇腾970系列​​:2028年Q4上市,全面升级的训练芯片,各项指标大幅提升

这一路线图显示了华为在AI芯片领域的长期承诺和技术积累,特别是在自研HBM内存和新型数据格式方面的突破。

Atlas 950:未来两年保持全球算力第一

Atlas 950超节点支持8,192张昇腾950DT芯片,规模是Atlas 900的20多倍。它由128个计算柜和32个互联柜组成,占地约1000平方米,采用全光连接。

​关键性能指标​​:

  • FP8算力:8 EFlops
  • FP4算力:16 EFlops
  • 互联带宽:16.3 PB/s(超过全球互联网总带宽的10倍)
  • 内存容量:1152 TB
  • 训练总吞吐:4.91mn TPS(较Atlas 900提升17倍)
  • 推理总吞吐:19.6mn TPS(较Atlas 900提升26.5倍)

与英伟达2025年将上市的NVL144相比,Atlas 950在卡规模上是其56.8倍,总算力是其6.7倍,内存容量是其15倍,互联带宽是其72倍。Atlas 950超节点上市时间为2026年第四季度,预计在未来两年内保持全球算力第一。

Atlas 960:算力再翻番

Atlas 960超节点基于昇腾960/昇腾950DT芯片,最大支持15,488卡,使用跨柜全光互联。其在Atlas 950基础上再度翻番:

  • FP8算力:30 EFlops
  • FP4算力:60 EFlops
  • 内存容量:4460 TB
  • 互联带宽:34 PB/s
  • 大模型训练和推理性能相比Atlas 950提升3-4倍

预计在2027年第四季度上市,将进一步巩固华为在AI算力领域的领先地位。

灵衢互联协议:突破万卡集群技术瓶颈

构建万卡超节点的最大挑战在于互联技术。华为通过系统性创新攻克了两大难题:

  1. 长距离高可靠联接:当前电互联技术距离短,光互联技术可靠性不足
  2. 大带宽低时延:当前跨柜卡间互联带宽低,时延大

基于此,华为开创了灵衢(UnifiedBus)互联协议,并正式开放云衢2.0技术规范,邀请产业伙伴共建生态,推动超节点产业发展。

超级集群:迈向Z级算力时代

华为还发布了由64个Atlas 950超节点并联组成的超级集群Atlas 950 SuperPlus,整合52万颗昇腾950T芯片,总算力达524 EFlops。

同时规划的Atlas 960 SuperPlus集群规模将达百万卡级,FP8总算力达2 ZFlops,FP4达4 ZFlops,预计2027年第四季度上市,将推动AI算力进入Z级时代。

通用计算超节点:重塑整个计算生态

超节点技术不仅用于AI,同样重塑通用计算。华为发布鲲鹏950、鲲鹏960芯片以及对应超节点。

鲲鹏950处理器提供96核/192线程和192核/384线程两个版本,支持机密计算,新增四层安全隔离。基于鲲鹏950组成的泰山950超节点将是全球首个通用计算超节点,最大支持16节点,32个处理器,最大内存48TB。

在数据库场景,基于TaiShan 950超节点打造的GaussDB读写架构无需分布式改造,性能提升2.9倍,可平滑替代大型机、小型机上的传统数据库。

产业意义:从技术追赶到生态引领

华为此次发布的意义远超产品本身,标志着中国企业在全球AI基础设施领域正从技术追赶走向生态引领。

通过开放灵衢互联协议和云衢技术规范,华为正在构建一个基于超节点技术的全新生态,这可能重新定义AI计算基础设施的标准和范式。

系统创新的胜利

华为的AI算力发展路径证明了一点:在单点技术受限的情况下,通过系统架构创新和生态建设,同样可以实现整体性能的跨越式发展。

Atlas超节点和集群的发布不仅是华为的技术胜利,更为整个AI产业提供了新的发展思路。在算力需求呈指数级增长的时代,华为正通过超节点技术为AI的未来发展提供强大动力。

随着2026年Atlas 950的量产,全球AI算力格局或将迎来重大变革,华为有望在AI基础设施领域实现从跟随到引领的历史性转变。

为您推荐