摩尔线程宣布完成智谱GLM-5.1极速适配

发布时间：2026-04-09来源：集成电路前沿

一、适配成果：Day-0 极速达成

4 月 8 日，摩尔线程在其旗舰级 AI 训推一体全功能 GPU MTT S5000 上，成功实现对智谱新一代旗舰模型 GLM-5.1 的 Day-0 极速适配，提供推理部署和训练复现全流程支持。这一成果彰显了国产算力基础设施对前沿 SOTA 模型的快速响应能力，为行业树立了软硬协同应对复杂 AI 推理场景的新标杆。

二、GLM-5.1：全球最强开源模型

GLM-5.1 是智谱迄今最智能的旗舰模型，也是目前全球最强的开源模型。它代码能力大幅提升，在最接近真实软件开发的 SWE-bench Pro 基准测试中，超越 GPT-5.4、Claude Opus 4.6，刷新全球最佳成绩。

不仅如此，GLM-5.1 在长程任务处理能力上实现显著突破。与当前分钟级交互的模型不同，它能独立、持续工作超 8 小时，期间自主规划、执行、自我进化，最终交付完整工程级成果。

三、软硬协同：适配调优有妙招

针对 GLM-5.1 的长程任务与代码生成特性，摩尔线程基于自研 MUSA 架构与 SGLang-MUSA、TileLang-MUSA 等关键技术，完成系统性的算子适配与推理性能调优。

MTT S5000 单卡 AI 算力（稠密）达 1000 TFLOPS，支持 FP8 到 FP64 全精度计算，原生 FP8 加速显著提升推理效率；高效 KV Cache 管理有效支撑极长上下文的显存需求；PD 分离架构解耦 Prefill 与 Decode 阶段，降低长序列生成干扰，保障持续任务高吞吐与低延迟。此外，784GB/s 的卡间互联带宽为大规模部署带来弹性扩展能力。通过软硬协同优化，MTT S5000 能稳定承接 GLM-5.1 的长程任务与工程级代码推理。