国产算力的“双轨突围”:深度与广度的战略分野
不到半年,国产算力的“天花板”被再次刷新。
2026年天津智博会,华为昇腾384超节点与中科曙光scaleX万卡超集群同台亮相。前者是去年WAIC的“镇馆之宝”,国产超节点的先行者;后者则是今年的焦点新品,展示了一套截然不同的系统架构。两者并非取代关系,而是代表了国产算力发展的两条并行的战略路径。

| 华为昇腾384超节点:系统集成的标杆
华为384超节点的行业地位毋庸置疑。它将384颗昇腾NPU与192颗鲲鹏CPU跨16个机柜互联,算力达307 PFlops。其核心思路是:在单卡性能尚需追赶的背景下,通过自研高速互联技术(带宽提升15倍,时延200纳秒),以系统工程的深度优化来弥补单点短板。这条路径追求的是极致的通信效率与系统可控性,适合对卡间交互延迟极为敏感的训练场景。
| 中科曙光scaleX万卡超集群:高密开放的新探索
曙光scaleX万卡超集群则展示了另一种维度的竞争力——高密度部署与架构开放性。
密度差异:华为384方案单机柜集成32张加速卡;曙光scaleX的超节点设计,单机柜可容纳640张卡。这意味着在同等算力需求下,曙光方案占用的物理空间显著更小,为机房空间有限或希望集约化部署的用户提供了新选择。
规模与成本:构建一个万卡(10240卡)集群,华为方案需要约26套384系统,机柜数超300个,跨组互联工程较为复杂。曙光通过高密架构,理论上仅用16个机柜即可实现万卡部署,并配合自研RDMA网络将通信效率提升18%(相对传统以太网基线)。这有助于将大规模AI训练集群的部署门槛和总拥有成本(TCO)大幅降低。
生态路径:华为走的是“垂直整合、软硬一体”的深度路线,护城河深,软硬件协同效率高。曙光选择了“开放架构”,scaleX不锁定特定品牌AI加速卡,支持多厂商混合部署。在当前供应链不确定性较高的环境下,这种弹性为用户提供了更多元的安全选项。
| 两条路径,互补而非对立
两者的区别,本质上是国产算力发展的两种战略侧重:
华为路径:依托芯片与通信全栈能力,打造垂直整合的生态,追求极致的系统效率、低延迟与自主可控。
曙光路径:发挥高端计算系统集成优势,以高密度和开放架构为突破口,追求极致的规模经济、部署灵活性与供应链弹性。
这两条路径并非简单的优劣之分,而是“深度”与“广度”的互补。华为证明了国产算力从核心互联到系统集成的深度可控能力;曙光则展示了国产算力在规模化普及、架构创新和开放生态上的另一种可能。
华为384超节点是国产算力自主创新的重要里程碑。中科曙光scaleX万卡超集群则提供了另一条差异化的高效路径。两者共同表明:国产算力的竞争,已从“解决有无”进入“定义好坏”的新阶段。一条路求深,一条路求广。这种健康的内部竞合,正是中国科技产业从追赶者迈向规则定义者的积极信号。
声明:本文仅为信息交流之用,不构成任何投资建议,股市有风险,投资需谨慎。

是说芯语,欢迎关注分享
合作洽谈,进入公众号:服务—>商务合作

