摩尔线程宣布完成智谱GLM-5.1极速适配

一、适配成果:Day-0 极速达成
4 月 8 日,摩尔线程在其旗舰级 AI 训推一体全功能 GPU MTT S5000 上,成功实现对智谱新一代旗舰模型 GLM-5.1 的 Day-0 极速适配,提供推理部署和训练复现全流程支持。这一成果彰显了国产算力基础设施对前沿 SOTA 模型的快速响应能力,为行业树立了软硬协同应对复杂 AI 推理场景的新标杆。
二、GLM-5.1:全球最强开源模型
GLM-5.1 是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。它代码能力大幅提升,在最接近真实软件开发的 SWE-bench Pro 基准测试中,超越 GPT-5.4、Claude Opus 4.6,刷新全球最佳成绩。
不仅如此,GLM-5.1 在长程任务处理能力上实现显著突破。与当前分钟级交互的模型不同,它能独立、持续工作超 8 小时,期间自主规划、执行、自我进化,最终交付完整工程级成果。

三、软硬协同:适配调优有妙招
针对 GLM-5.1 的长程任务与代码生成特性,摩尔线程基于自研 MUSA 架构与 SGLang-MUSA、TileLang-MUSA 等关键技术,完成系统性的算子适配与推理性能调优。
MTT S5000 单卡 AI 算力(稠密)达 1000 TFLOPS,支持 FP8 到 FP64 全精度计算,原生 FP8 加速显著提升推理效率;高效 KV Cache 管理有效支撑极长上下文的显存需求;PD 分离架构解耦 Prefill 与 Decode 阶段,降低长序列生成干扰,保障持续任务高吞吐与低延迟。此外,784GB/s 的卡间互联带宽为大规模部署带来弹性扩展能力。通过软硬协同优化,MTT S5000 能稳定承接 GLM-5.1 的长程任务与工程级代码推理。
四、持续发力:共建国产 AI 生态
从 GLM-4.7 到 GLM-5.1,摩尔线程已连续实现发布当日极速适配。这既体现了 MUSA 架构对主流 AI 生态的深度兼容,更标志着国产全功能 GPU 已具备大模型“从适配到部署”的全链路支撑能力。未来,摩尔线程将持续夯实算力底座,助力开发者快速应用前沿模型,共建更成熟的国产 AI 生态。

集成电路行业交流群

免责声明:本文内容来源于网络,除原创作品,本平台所使用的文章、图片等相关内容,属原权利人所有。集成电路前沿转载仅作为行业信息及新闻分享,不代表集成电路前沿支持或赞同本文观点,若有任何异议或侵权,敬请联系集成电路前沿,我们会及时处理,谢谢!






集成电路前沿每日为大家奉上最新的集成电路行业资讯,欢迎扫描下方二维码关注
|


