业界首个通算超节点产品,华为TaiShan 950 SuperPoD值得关注!
最近这两年,超节点的概念火遍全网,吸引了行业内外的广泛关注。
所谓超节点,其实简单来说,就是一个整机化的算力“小集群”。它能够提供强大的算力,满足多种高负荷场景的需求。
我们此前看到的超节点,基本上都是智算超节点,提供AI算力,用于大模型训推。
如今,情况有了变化,除了智算超节点之外,通算超节点也开始崛起。
去年,华为在全联接大会2025上推出的TaiShan 950 SuperPoD,就是一个通算超节点。今年在MWC巴塞展上,再次进行了高调展示。
那么问题来了——智算之所以提超节点,是因为AI训练对算力密度、互联带宽和能效比的要求极为严苛。通算场景,难道也面临同等挑战?华为推出通算超节点,目的是什么呢?
通算,就是通用计算,是计算三大范式之一,承载着数据库、中间件、WEB、ERP、OA等关键业务,亦是支撑政府运转、企业经营以及居民日常生活的底层基石。
众所周知,智算服务于模型训推,追求极致峰值算力。而通算则不同。除了算力之外,它还特别强调高可靠性、强一致性、低时延响应、广泛兼容与长期稳定运行。
换言之,如果我们把智算看作是抢尽风头的“前锋”,那么,通算就是默默坚守的“后卫”,要负责给数字社会“兜底”。

近年来,随着整个社会数字化转型的加速推进,通算的业务场景和需求正在发生深刻变革。
一方面,通算负载正从传统单体架构向云原生微服务演进,业务并发量激增、业务峰值波动加剧。这不仅要求通算系统具备更强的算力规模,还需要具备更灵活的弹性伸缩能力和资源调度能力。
另一方面,通算业务场景正在向多样化的方向发展。从金融核心交易到工业实时控制,从智慧城市中枢到数智医疗健康,越来越多的场景对通算系统提出毫秒级响应、超高可靠性、超强安全性、多协议兼容、跨域协同等全新要求。
第三,是AI业务对通算的需求正在增长。
AI业务并不是只依赖于智算,它同样也需要通算。例如,AI模型的部分推理服务,以及AI机头节点、数据预处理、任务编排、内存管理、网络栈调度、特征工程、模型管理与监控等环节,均运行在通算基础设施之上。
通算是AI集群的神经中枢和调度中心,决定AI集群的整体效率。
第四,是数据业务蓬勃发展提出更高挑战。
AI推动企业数据激增,数据库和存储系统需求持续增长。这也依赖于通算的持续进化与能力跃升。当数据洪流奔涌而至,通算不能仅仅是被动承载,更需要主动感知、智能分流、精准调度,在毫秒间完成数据处理任务。
简而言之,通算需求场景正从“基础通用、独立部署”走向“智通融合、云边端协同、绿色高效、行业深度定制”的新阶段。传统的通算架构(服务器堆叠),虽然提升了算力规模,但牺牲了算力利用率,在响应时延、弹性扩展、安全可信与能效比等方面,都已难以满足新阶段的严苛要求。
一场从芯片、指令集、通信协议到软件栈的全栈式架构革新,势在必行。而通算超节点的出现,正是这场革新的关键突破点。
华为推出TaiShan 950 SuperPoD,显然是洞察到了通算领域目前所经历的变革,以及变革中蕴藏的商业机遇。
我们还是先看看华为通算超节点的基本情况。
TaiShan 950 SuperPoD,采用了灵衢(UnifiedBus)互联协议,主打超低时延、超大带宽、内存统一编址,用于突破传统通用计算集群的能力瓶颈。

(图片来自:华为全联接大会 2025年)
灵衢,是华为超节点架构的灵魂。它充分发挥了华为在通信技术上的技术优势,构建了“低时延、高带宽、高可靠”的互联传输体系。
目前,在灵衢2.0的支撑下,鲲鹏超节点的节点之间通信时延压缩至百纳秒级,带宽高达TB级。内存、SSD、DPU等资源也全面池化,其中最大内存池容量可达24TB(典配8节点的情况下)。
更关键的是,灵衢支持跨节点的内存统一编址技术和内存语义访问,让不同节点的内存拥有统一的地址空间,分布式任务调度无需数据搬移,直接调用远端资源。这就像一个拥有很多房间的图书馆,所有房间的书架都连通且编号唯一,读者找书更加方便,不需要每个房间都设置图书管理员进行中转。

我们可以把灵衢看成是一个强大的神经和血管网络。它对超节点的物理资源进行统一纳管,实现了资源的逻辑解耦、动态重组和平等互联。这种深度的资源整合与统一调度,使得超节点内部的多台服务器在逻辑上“凝聚”成为一台巨型计算机,从根本上提升了算力效率与系统可靠性。
华为一直强调的“以非摩尔补摩尔,以数学补物理,以群计算补单芯片”,在超节点上得到了具象化的体现。
接下来,我们再看看TaiShan 950 SuperPoD的应用场景。
TaiShan 950 SuperPoD是一个通算“巨无霸”。前面我们提到的那些时代发展带来的通算需求,传统服务器堆叠根本搞不定,而TaiShan 950 SuperPoD就能够很好地应对。
尤其是在数据库、虚拟化、大数据分析等业务场景,TaiShan 950 SuperPoD的表现更加突出。
在数据库场景,以灵衢互联为基础形成内存池化能力和超低时延通信,大幅提升事务处理性能,非常适合数据库的多读多写架构,OLTP数据库,TaiShan 950 SuperPoD+openGauss多写数据库是openGauss多写+TaiShan 200 V2 tpmC性能的1.5倍。
在已经十分成熟的通算领域,能带来如此巨大的性能跃升,确实是令人出乎意料。这恰恰印证了灵衢彻底重构通算架构带来的巨大价值。不再依赖硬件堆叠的线性增长,而是通过大带宽、低时延的高速互联、内存统一编址、全局资源池化,同样可以释放出指数级的协同效能。
根据IDC的数据,通算的算力虽然占整体比例不高,但仍达到千亿级别。2024年底,全球通算算力规模为628 EFLOPS。到2030年,这一数据将达到3.3ZFLOPS,年复合增长率高达32.6%。这意味着,通算算力规模每两年几乎翻倍,背后是巨大的商业价值和机遇。
与此同时,通算基础设施的演进逻辑正在经历重塑。通算算力从被动响应走向主动协同,从功能堆砌转向能力生长,从成本中心升维为业务创新引擎。
TaiShan 950 SuperPoD的推出,时机恰到好处。小枣君相信,市场一定会给予积极反馈,而且,也会引领行业更多的企业跟进效仿。
通算计算范式正在经历一场深刻变革。华为能否率领国产通算算力全面崛起,趁此机会改写全球通算格局?让我们拭目以待。

