智谱 GLM-5.1“Day0”上线华为云,在昇腾算力上实现 Layer 级 MOE 绝对均衡
发布时间:2026-04-08来源:IT之家
感谢IT之家网友
Autumn_Dream
的线索投递!
IT之家
4 月 8 日消息,智谱今天正式发布新一代旗舰模型 GLM-5.1。华为官方宣布,
智谱 GLM-5.1“Day0”上线华为云
。

据介绍,智谱 GLM-5.1 在昇腾算力上实现了 Layer 级 MOE 绝对均衡,通过框架能力优化让专家均衡产出 Token,同时结合昇腾 Attention 算子特征,通过推理框架和硬件协同的定向优化,提升算力均衡和 HBM 访存均衡能力。
华为云通过系统级优化,实现推理加速,整体吞吐提升 30%
。
当前,华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用智谱 GLM-5.1 API 的 Tokens 服务,支持在线体验。企业也可通过华为云魔坊(ModelArts)模型训推平台,一键完成推理服务部署上线,支持公共池和专属池两种资源部署方式,满足独占和非独占算力的使用诉求。
据IT之家今日早些时候报道,
智谱 GLM-5.1 号称目前全球最强的开源模型
。官方表示,
其是唯一达到 8 小时级持续工作的开源模型
,在最接近真实软件开发的 SWE-bench Pro 基准测试中,GLM-5.1 实现国产模型首次超越 Opus 4.6。

相关阅读:
《
智谱发布可持续工作 8 小时的旗舰模型 GLM-5.1,同时提价 10%
》
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。
