DeepSeek-V4正式发布华为云实现首发适配

发布时间：2026-04-24来源：环球网科技

【环球网科技报道记者张阳】4月24日，DeepSeek-V4模型正式发布并开源，华为云率先完成适配上线。该模型具备百万Token级超长上下文，在智能体能力、世界知识覆盖及推理性能方面均达到国内及开源领域的领先水平。

其中，DeepSeek-V4-Flash版本参数量降至284B，进一步降低了推理成本。该版本以更小的模型参数与激活参数，提供更高效、经济的API服务，推动百万级上下文能力的普惠应用。目前，华为云MaaS（模型即服务）平台已面向开发者提供免部署、一键调用DeepSeek-V4-Flash API的Token服务。

在此次模型适配过程中，华为云从系统层、算子层到集群层进行了全面协同优化，聚焦调度效率、计算效率与数据流转效率三大维度，保障新模型的快速适配与高性能落地。

针对DeepSeek-V4，华为云首发适配了模型的分层注意力压缩机制，实现了对V4注意力机制下KVCache的高效分配管理。同时，平台集成了TopK、SWA、CFA等十余项昇腾高性能融合算子，结合框架异步调度与多步投机解码等优化手段，支持原生百万级长上下文的高性能推理。

华为云以高效AI基础设施为核心，打造“硅基黑土地”，开放兼容自研及第三方主流大模型与众多智能体，助力企业解决业务难题、提升生产效率。

据悉，金山办公、360等企业已通过华为云接入DeepSeek新模型。此外，DeepSeek-V4-Pro版本也将于近日上线。

转载说明：本文系转载内容，版权归原作者及原出处所有。转载目的在于传递更多行业信息，文章观点仅代表原作者本人，与本平台立场无关。若涉及作品版权问题，请原作者或相关权利人及时与本平台联系，我们将在第一时间核实后移除相关内容。

DeepSeek-V4正式发布 华为云实现首发适配

DeepSeek-V4正式发布华为云实现首发适配