DeepSeek-V4正式发布 华为云实现首发适配
发布时间:2026-04-24来源:环球网科技
【环球网科技报道 记者 张阳】4月24日,DeepSeek-V4模型正式发布并开源,华为云率先完成适配上线。该模型具备百万Token级超长上下文,在智能体能力、世界知识覆盖及推理性能方面均达到国内及开源领域的领先水平。

其中,DeepSeek-V4-Flash版本参数量降至284B,进一步降低了推理成本。该版本以更小的模型参数与激活参数,提供更高效、经济的API服务,推动百万级上下文能力的普惠应用。目前,华为云MaaS(模型即服务)平台已面向开发者提供免部署、一键调用DeepSeek-V4-Flash API的Token服务。
在此次模型适配过程中,华为云从系统层、算子层到集群层进行了全面协同优化,聚焦调度效率、计算效率与数据流转效率三大维度,保障新模型的快速适配与高性能落地。
针对DeepSeek-V4,华为云首发适配了模型的分层注意力压缩机制,实现了对V4注意力机制下KVCache的高效分配管理。同时,平台集成了TopK、SWA、CFA等十余项昇腾高性能融合算子,结合框架异步调度与多步投机解码等优化手段,支持原生百万级长上下文的高性能推理。
华为云以高效AI基础设施为核心,打造“硅基黑土地”,开放兼容自研及第三方主流大模型与众多智能体,助力企业解决业务难题、提升生产效率。
据悉,金山办公、360等企业已通过华为云接入DeepSeek新模型。此外,DeepSeek-V4-Pro版本也将于近日上线。
转载说明:本文系转载内容,版权归原作者及原出处所有。转载目的在于传递更多行业信息,文章观点仅代表原作者本人,与本平台立场无关。若涉及作品版权问题,请原作者或相关权利人及时与本平台联系,我们将在第一时间核实后移除相关内容。
